Happy Scribe transcribe y subtitula con
IA para la ONU, Forbes, la BBC y Spotify

La empresa, fundada por dos universitarios irlandeses, se instaló en Barcelona hace cinco años. Su ingeniero Bernat Felip, que tiene una discapacidad auditiva, comparte los secretos del éxito de la firma


Arantxa García

Barcelona | 15 de abril de 2024

El equipo de la empresa está compuesto por profesionales de numerosos países. (Foto: Happy Scribe)

E l día anterior a su entrevista con Hutopia, celebró su primer aniversario en Happy Scribe. Bernat Felip, ingeniero de software especializado en implementar la Inteligencia Artificial (IA), dentro la firma, tiene discapacidad auditiva, de ahí que los subtítulos sean vitales en su vida cotidiana. “Me encanta la empresa. Soy medio sordo, ya que no oigo de un oído. Así que me siento identificado con las soluciones que ofrece la firma”, confiesa.

Los modelos de la compañía están diseñados para llevar a cabo transcripciones de manera automática y rápida. La firma también ofrece la posibilidad de realizarlas a través de profesionales especializados en esta labor, que se encargan de corregir y perfeccionar los contenidos generados por la IA. Esta pyme, actualmente domiciliada en Cataluña, representa la combinación equilibrada entre el uso de la tecnología y la intervención humana para “garantizar los mejores resultados”. "Nuestro principal enfoque es proporcionar servicios de transcripción, tanto en su forma pura como en la de subtítulos, especialmente dirigidos a agentes relacionados con el mundo audiovisual", explica.

Felip estudió un doble grado de Informática y Telecomunicaciones en la Universidad Politécnica de Cataluña y, al acabar la carrera, hizo su TFG en el reputado Massachusetts Institute of Technology (MIT). “Al volver a Barcelona, cursé un máster de Machine Learning, tras el cual recibí ofertas para sumergirme más en el mundo de la IA, que me interesaba desde la universidad”, relata. Poco después aterrizó Happy Scribe porque se sentía identificado con sus “valores, misión y objetivos”.

Bernat Felip: “Soy medio sordo, y los subtítulos y la transcripción para mí son algo vital en mi vida”

Happy Scribe fue fundada en Irlanda por Andre Bastie y Marc Assens Reina en 2017, mientras ambos eran estudiantes universitarios. Siete años más tarde, tiene una base de 100.000 usuarios, sobre todo de Europa y Estados Unidos. Inicialmente, los fundadores desarrollaron un código utilizando el algoritmo de Google, pero posteriormente crearon el suyo propio. Este proyecto culminó en una aplicación que automatiza la transcripción, la creación de subtítulos y la traducción en más de ochenta idiomas y dialectos utilizando IA y la asistencia de lingüistas profesionales.

El equipo, detalla Felip, tiene la capacidad de transformar cualquier contenido de audio en texto con una precisión del 90 %. Aunque sus primeros usuarios fueron estudiantes, actualmente la mayoría son grandes empresas e instituciones, como la BBC, el Parlamento y la Generalitat de Cataluña, la ONU, Forbes y Spotify, entre otros. “El objetivo es agilizar todo este proceso que antiguamente estaba hecho por agencias de transcripción, de una forma más eficiente y a mayor escala. También trabajamos con agencias y empresas de comunicación y entretenimiento, que hacen series o anuncios, o con algunos youtubers. El abanico es muy amplio ”, concreta.

EL ORIGEN DE LA IDEA

Los fundadores de Happy Scribe decidieron desarrollar sus propios algoritmos para utilizar la IA con el fin de gestionar la gran cantidad de información y datos que manejaban. "Cuando se dieron cuenta del desafío y de que la cantidad de información estaba aumentando constantemente, contactaron con mi compañero Oleguer Canal", recuerda.

La clave reside en la innovación, enfocada a que sus modelos de IA generen siempre el contenido que mejor se adapte a las necesidades de los usuarios. Con solo un año en la empresa, Felip ha contribuido al desarrollo de varias actualizaciones de las plataformas de Happy Scribe, como una herramienta para realinear las transcripciones con el audio en el caso de que haya errores. Sin embargo, el ingeniero destaca que trabajar con la IA tiene un alto grado de complejidad, ya que reprogramar los algoritmos requiere mucho tiempo e investigación de parte del equipo.

Un pilar importante de su labor es fomentar la accesibilidad para personas con audición limitada y discapacidad auditiva: “La accesibilidad es prácticamente esencial. Muchas empresas necesitan subtitular sus vídeos internos, desde sesiones de formación de recursos humanos hasta cualquier otro contenido". De hecho, son ya varias las compañías que utilizan Happy Scribe para este propósito.

Los modelos desarrollados por la empresa transcriben y subtitulan en más de ochenta idiomas y dialecto

Con un futuro más que prometedor, la firma está decidida a seguir explorando los límites de la IA. A corto plazo, quiere expandirse hacia otros soportes más allá del audio, explorando las posibilidades del vídeo y “cómo integrar diferentes modalidades”. A largo plazo, aspira a “resolver por completo” el desafío de la transcripción mediante IA, permitiendo que los seres humanos se dediquen únicamente a “tareas que requieran su toque personal”.

Y, para lograrlo, Happy Scribe mira más allá de las fronteras españolas. Porque, debido a su proyección internacional, tiene la necesidad de contar con un importante número de profesionales extranjeros. Por eso, todos hablan en inglés dentro de las oficinas de Barcelona. “Es la forma de incluir a todo el mundo. Si lo haces en español o en catalán, habrá personas que se sientan un poco excluidas. Nos esforzamos para tener una cultura diversa”, comparte Felip.




+