NUEVA PROFESIÓN

Las galeras de Google: cientos de personas transcriben en este edificio lo que le dices a tu móvil

Se encargan de transcribir las grabaciones o mejorar las transcripciones que hace la Inteligencia Artificial al hablarle al asistente de Google

Procedentes en su mayoría de carreras de Letras y de muchas nacionalidades, cobran apenas el sueldo mínimo por jornadas de nueve horas

"Es el infierno, el trabajo más mecánico que he hecho nunca", asegura uno de los ex trabajadores de esta compañía fundada en 2008

Transcriptoras a la salida de la oficina de Sigma

Transcriptoras a la salida de la oficina de Sigma / Alba Vigaray

Analía Plaza

Analía Plaza

Cae la tarde en Madrid y los trabajadores del número 114 de la Avenida de Burgos —un edificio rodeado de concesionarios, frente a la carretera, a muy pocos metros del trenzado de autopistas conocido como nudo de Manoteras— empiezan a abandonar la oficina.

Su hora oficial de salida son las seis, aunque el goteo empieza un poco antes. Hay varias empresas con sede en el inmueble, pero es fácil reconocer a los que proceden de una en concreto porque llevan tarjetitas identificativas colgadas al cuello.

Sigma AI, la marca bajo la que opera Sigma Technologies SL, es una compañía española especializada en

inteligencia artificial

. Fue fundada en 2008 por un ingeniero, Daniel Tapias, y una financiera, Nuria Gómez, que venían de trabajar en grandes empresas.

"Desde el principio de mi carrera he trabajado en inteligencia artificial, fundamentalmente en tecnologías del habla y del lenguaje, el área que investigué durante quince años mientras estaba en Telefónica I+D", explica Tapias a EL PERIÓDICO DE ESPAÑA. "El desarrollo de estos sistemas necesitaba un volumen de datos muy grande, lo que nos proporcionó mucha experiencia en el ámbito de la anotación de datos a gran escala".

La mayoría de personas que salen del 114 de la Avenida de Burgos con la tarjeta identificativa de Sigma trabajan en esta "anotación de datos a gran escala".

Son jóvenes, buena parte de ellas mujeres, de distintas nacionalidades. Su jornada laboral empieza a las nueve de la mañana y consiste en transcribir audios cortos o en corregir transcripciones ya hechas por una inteligencia artificial.

Los audios proceden principalmente del asistente de Google, una aplicación que suele venir preinstalada en todos los teléfonos con Android y que es el equivalente al Siri de iPhone, según han descrito a EL PERIÓDICO DE ESPAÑA varios ex-trabajadores de Sigma consultados. El asistente se activa cuando el usuario dice "Ok Google" y permite realizar búsquedas por voz.

Los transcriptores que trabajan para Sigma reciben estos audios y los pasan a texto, o bien revisan el audio y el texto que ha entendido Google y lo corrigen si hay algo mal. Es, en palabras de los consultados, un trabajo duro, repetitivo y alienante cuyo fin último es entrenar y mejorar la inteligencia artificial.

Era el puto infierno. El trabajo más mecánico que he hecho nunca

"El puto infierno. El trabajo más mecánico que he hecho nunca", describe una de estas personas. "Tú ahí no eras un ser humano, te convertías en una máquina, no había ninguna injerencia de tu pensamiento. No volvería, fue un momento un poco extremo de mi vida".

Entre los audios que les toca escuchar hay de todo. "Son búsquedas de Google. Muchos juguetes. A veces había búsquedas sexuales, o venía el señor de turno a buscar prostitutas en un barrio concreto. Conoces la realidad", apunta un ex-trabajador. "Muchísimas canciones, muchísimos niños, muchísimas búsquedas de vídeos divertidos. La gente que quería ver porno hablaba en voz muy baja y pensaba: madre mía, qué pervertido. Me los imaginaba en su casa intentando que no lo oyera su mujer", añade otra.

Búsqueda por voz en Google (a través de la barra de búsqueda, no de Google Assistant)

Búsqueda por voz en Google (a través de la barra de búsqueda, no de Google Assistant) / Alba Vigaray

La empresa obliga a los empleados a firmar un acuerdo de confidencialidad, razón por la cual sus identidades quedarán en el anonimato. El ambiente en la oficina desde que se supo que esta redacción preparaba un artículo sobre ellos es de "mucho miedo", tal y como describieron dos responsables en la puerta del edificio.

Preguntadas qué otros tipos de trabajo se llevan a cabo en las oficinas, hablan de que solo conocen "este proyecto". Se refieren a Google, pero evitan mencionar su nombre. El fundador y CEO, que ha respondido por escrito a una batería de preguntas de EL PERIÓDICO DE ESPAÑA, también evita relacionar sus proyectos con Google y advierte de que "la información relativa a clientes" es "estratégica y confidencial".

De acuerdo a las cuentas anuales de los últimos años depositadas en el Registro Mercantil, Sigma emplea a entre 100 y 170 personas de media cada año. Prácticamente todos son temporales. Las cuentas también reflejan que es un trabajo feminizado. En 2020, las últimas presentadas, cerraron con 195 mujeres y 57 hombres temporales contratados (25 hombres y 31 mujeres fijas).

El CEO asegura, sin embargo, que "los contratos temporales se han ido pasando a indefinidos según se han ido consolidando los proyectos de los clientes y, en este momento, casi todos los contratos son indefinidos".

La filtración que llevó al secretismo

El miedo que inunda las oficinas y el secretismo en torno al proyecto tienen su origen en una información publicada hace tres años.

En julio de 2019, la cadena de televisión pública belga VRT NWS publicó cerca de un millar de audios de Google filtrados por un transcriptor. De estos, 153 eran conversaciones aleatorias captadas por los teléfonos, no interpelaciones dirigidas al asistente. El escándalo fue tal que Google suspendió todos los proyectos, según informó El País, y los transcriptores en España se quedaron sin trabajo.

Google reconoció en un comunicado oficial en su blog que empleaba a "expertos del lenguaje de todo el mundo" para revisar "alrededor del 0,2%" de los audios generados y aseguró que no están asociados a las cuentas de los usuarios. En aquel momento, y por la información publicada en medios de tecnología, la compañía no avisaba en su política de privacidad de que empleaba a humanos para revisar audios.

Actualmente, según ha comprobado este diario, sí lo hace. Al configurar el asistente de voz te pregunta si quieres guardar las grabaciones de audio y apunta: "Google utiliza tu audio para desarrollar y mejorar sus tecnologías de reconocimiento de audio y los servicios de Google que las utilizan. Para ello, unos revisores especializados escuchan, transcriben y anotan una muestra audio para analizarla".

Aceptando guardar las grabaciones, aceptas que esos audios puedan ser revisados por otra persona. "En agosto de 2020 reiniciamos este tipo de proyectos en Estados Unidos y enviamos un correo a los usuarios explicando que íbamos a apagar la grabación para todo el mundo y que solo la activaríamos en caso de que el usuario quisiera", explican fuentes de Google España a este periódico.

En cualquier caso, los transcriptores apuntan que las conversaciones aleatorias se siguen colando.

"Para activar el asistente tienes que decir 'Ok, Google'. En italiano, por ejemplo, se dice mucho 'ok, ok'. Y ahí el móvil se activa y cuando te llega el audio te das cuenta de que estás escuchando una conversación, no a alguien hablando al móvil", explica un ex-trabajador. "A mí me regalaron un Echo pero desde que trabajé en este proyecto prefiero no usarlo".

Si dices 'ok', el móvil se activa y lo que te llega es una conversación

Según desveló la revista Time, Amazon también emplea a miles de trabajadores que escuchan y transcriben los audios de Alexa, el asistente virtual instalado en los dispotivos Echo. El etiquetado de textos, como el de imágenes, "existe desde hace mucho tiempo y se ha popularizado en los últimos cinco", apunta la doctora en Inteligencia Artificial Nerea Luis, "pero es muy costoso y gran parte de lo que se presupuesta en este tipo de proyectos se dedica a eso".

En función del nivel de privacidad que requiera la empresa se puede subcontratar (como hace Google con Sigma) o hacer internamente.

Amazon creó hace años Mechanical Turk, una plataforma en la que empresas vuelcan sus tareas de etiquetado para que personas las resuelvan a cambio de un módico precio. Las tareas se llaman HITs (Human Intelligence Tasks, o tareas de inteligencia humana). Un ejemplo reciente: transcribir los números de un ticket de la compra por 11 céntimos de dólar.

La doctora Luis ha trabajado en proyectos en los que ha acudido a Mechanical Turk, pero también ha etiquetado imágenes ella misma porque sus clientes requerían máxima confidencialidad.

"¿Desde cuándo se entrenan estos sistemas? Desde que podemos recoger archivos de la actividad humana de forma masiva", dice Gemma Galdón, investigadora y fundadora de Ethicas Research, empresa especializada en auditar algoritmos. "El etiquetado de esas conversaciones no tiene dificultad técnica, pero antes no teníamos acceso a tantas y no podíamos clasificarlas para entrenar a una inteligencia artificial".

Una "máquina de precariedad"

Sigma AI finalizó el proyecto con Google en 2019, pero lo retomó hace varios meses y volvió a contratar. En el momento de escribir estas líneas tiene publicados varios anuncios en Infojobs buscando transcriptores presenciales de español, inglés, francés, italiano, portugués, alemán, ruso, polaco, árabe, danés, noruego, holandés y sueco. No es de extrañar, por tanto, que a la salida de la oficina y en la parada de autobús más cercana, en la que grupos de empleados aguardan para volver a su casa, se oigan idiomas variados.

El documento con las condiciones de trabajo, al que ha accedido EL PERIÓDICO DE ESPAÑA, explica que los candidatos harán una prueba antes de empezar. Si la pasan y son contratados, su objetivo será transcribir 270 frases por hora en el caso de audios cortos que ya estén transcritos, y 150 frases por hora en el caso de audios cortos que haya que transcribir. También hay tareas de revisión y de transcripción de audios largos (un consultado explica que, además de audios cortos, transcribió vídeos de YouTube).

El CEO asegura que estas condiciones son solo las de "uno de los muchos tipos de proyectos" que tienen.

El edificio en el que están las oficinas de Sigma AI

El edificio en el que están las oficinas de Sigma AI / Alba Vigaray

La empresa ofrece 1.200 euros brutos al mes —unos 1.000 euros netos, como el salario mínimo— y contratos de obra y servicio. Antes del escándalo de Google, y según los transcriptores consultados, Sigma pagaba por cada audio traducido y permitía a la gente hacerlo desde casa.

"Esto es una máquina de precariedad que se filtra de boca en boca entre todos los que estudiamos carreras de letras", sostiene uno de los antiguos transcriptores. "No hay salidas en humanidades, así que prácticamente todos mis amigos de la universidad acabaron trabajando ahí. Yo era periodista, me quedé sin trabajo y recurrí a ello durante unos meses. Lo hacía desde casa, me tocaron audios de México y mis compañeras de piso se quedaban locas. Escuchaban a niños mexicanos preguntando a Google por los 'casimeritos' [unos juguetes muy populares] y cosas así. Yo estaba en mi habitación y me pegaba una panzada de escuchar cientos de audios a la hora lo más rápido posible. Cuando me tocaba transcribir no compensaba. Era muy arduo, pero me sacaba un dinero para subsistir".

Ahora, la empresa exige acudir cada día a la oficina y hacer una jornada completa, lo que desanima a algunos candidatos.

La salida de la oficina de Sigma AI

La salida de la oficina de Sigma AI / Alba Vigaray

"Yo trabajé en ese proyecto en 2019 para Sigma. Soy traductora autónoma y desde casa lo compaginaba bien, pero ahora piden ir a la oficina nueve horas al día y cinco días a la semana. Sugerí ir menos horas al día y me dijeron que no era un proyecto para autónomos. Imaginé que era por seguridad", sostiene una antigua transcriptora. "Si lo haces durante ocho horas al día te vuelves loco. Dos horas al día es aburrido, pero te pones y lo haces".

Revisando perfiles de transcriptores en LinkedIn se observa que muchos de ellos empezaron en la compañía entre abril y junio de 2021. Aunque casi siempre ha sido una empresa rentable, la facturación y los beneficios Sigma se dispararon a partir de 2017 y volvieron a caer en 2020, el siguiente a que Google cortara el primer proyecto (también el año de la pandemia).

Si inteligencias artificiales como la de Google ya entienden buena parte de lo que les dicen los humanos gracias al trabajo de anotación de los transcriptores, ¿hasta cuándo será necesario alimentarlas?

Las expertas en inteligencia artificial consultadas coinciden en que este trabajo aún tiene muchísimo recorrido.

"Estamos en la punta del iceberg. Hay cosas genéricas. En español no hay tanto y en dominios específicos, menos. También existen modelos entrenados que no se pueden emplear porque son de uso académico", dice la doctora Luis.

La figura del lingüista computacional —que sabe de lingüística pero también es capaz de procesar datos— se ha revalorizado "mucho" en los últimos tiempos. "Imagino que los profesionales de la traducción empezarán a sentirse atraídos por este mundo", añade.

"Habrá que enseñarles siempre porque la lengua y la forma de comunicarnos evoluciona", añade Galdón. "Y tampoco nos entienden tanto. Nos entienden cuando nos adaptamos a ellos. Cuando hablamos con estos sistemas los humanos nos ablandamos, como si habláramos con un bebé. En una conversación con amigos no serán capaces de recoger mucha información válida".

"Mi opinión es que está muy lejos el momento en el que no haga falta anotación manual. Cuanto más avanza la IA, más temas se pueden abordar y más datos y tipos de datos hay que anotar", concluye Daniel Tapias, el fundador y CEO de Sigma. "También la anotación se vuelve más compleja. Es cierto que algunas tareas básicas se hacen de forma automática y otras menos básicas de forma semiautomática. Esto está permitiendo aumentar el volumen de datos que se pueden anotar y que los anotadores se puedan dedicar a las tareas que solo un ser humano puede acometer con la calidad necesaria".