VALÈNCIA. La tecnológica valenciana Voicemod ha cerrado una ronda de inversión de 14,5 millones de dólares con la entrada del fondo español Kfund, el impulso del inversor alemán Bitkraft Venture -que lideró la anterior inyección de financiación- y el refuerzo de The Mini Fund, vehículo de inversión impulsado por Eros Resmini, uno de los cofundadores de la conocida plataforma Discord.
Así lo apunta su CEO, Jaime Bosch, quien fundó la compañía junto a sus hermanos Juan y Fernando en una aventura que empezó en 2009 y que ha crecido hasta facturar 12,5 millones el pasado año y emplear a 156 personas. "La ronda es muy interesante, porque no es solo capital puro y duro, sino que tiene una parte bastante importante de network", explica Bosch, que hace un lustro estuvo a punto de bajar la persiana de la compañía.
Ahora, su pasión por la música tiene forma de ecosistema digital de modulación de voces y sonidos, que despegó con el sector del gaming y los juegos online para personalizar voces. Ahora, sus desarrollos aspiran a convertirse en un vehículo para que cualquiera pueda formar su identidad y dar rienda suelta a su manera de expresión a través de la voz. Para afrontar todo este proceso, Bosch fichó un COO para escalar equipos y hacer crecer a la empresa. Una decisión que en los últimos dos años les ha llevado de captar tres millones de descargas a más de 40 millones.
La compañía, que hasta hace escasos años solo contaba con su plataforma de escritorio para aplicar filtros desde Windows, ha seguido desarrollando productos en torno a la voz. Entre éstos se encuentra Tuna, una web de sonidos al estilo Giphy, en la que han generado un portal de sonidos que la gente sube para que otros puedan usarlos. Además, permite otras funciones como escoger un audio, una voz, estilo musical y poner un texto para crear tus propias canciones. También, están desarrollando una app móvil y ya testean en beta la aplicación de escritorio para Mac.
En su estrategia, Voicemod compró a la compañía catalana Voctro Labs, dedicada a la tecnología musical y a la inteligencia artificial. Fundada por Jordi Janer, Oscar Mayor, Jordi Bonada y Merlijn Blaauw, se trata de una spin-off del Grupo de Tecnología Musical de la Universitat Pompeu Fabra (Barcelona). Con su colaboración, lanzaron las primeras voces generadas con inteligencia artificial en septiembre de 2022, con un fuerte éxito entre sus usuarios. Su tecnología permite cantar en tiempo real con la voz de otro cantante. Ahora, sus cuatro impulsores se han incorporado al equipo de Voicemod.
"Hasta ahora, nuestra tecnología se usaba con los amigos y tu grupo, igual que utilizo un sticker o un emoji para expresarme en un momento muy puntual", explica Bosch. "Ahora, estas voces las pueden llevar puestas todo el rato para crear una identidad o amplificar la manera de expresión. Con estos nuevos filtros, hay mucho más engagement y atrae a un tipo de usuario diferente. Tiene mucho que ver con la tendencia del metaverso, de los avatares y de crear experiencias más inmersivas", señala.
Hasta ahora, la tecnología de la compañía se basaba en una señal eléctrica que se modifica. Sin embargo, el futuro es que, aunque la entrada sea la voz uno mismo, el output esté basado en una inteligencia artificial entrenada con un algoritmo y una voz sintética desde cero. "Esto permite voces más naturales y realistas, que no estén condicionadas a tu voz original. Es como si hubiésemos ganado un grado de realismo", destaca. "Lo que antes era más tipo juguete, a algo que es mucho más real".
Con todos los nuevos desarrollos, su intención es crear un ecosistema en el que crear un sonido en el móvil o en el ordenador y pueda ser parte de todas las redes sociales. "Esto permitiría que, si tú creas un sonido en la herramienta de escritorio que tiene una tecnología más compleja, luego puedas tenerla en el móvil", apunta el CEO de Voicemod.
La compañía cuenta con alrededor de 90 ingenieros, un fuerte equipo de I+D para desarrollar la parte tecnológica y con un gran enfoque a la inteligencia artificial. Una compañía en la que también cuentan con desarrolladores, diseñadores, marketing y product managment, entre otros perfiles. Además, disponen de un equipo de data que ayuda en la toma de decisiones en el conjunto de equipos. La tecnológica, aunque tiene su sede en València, cuenta con trabajadores de 24 países.
Entre los nuevos planes de la empresa, está abrir un área de b2b en la que ofrecen su tecnología a las compañías para que las puedan integrar directamente en sus productos. "Hasta ahora Voicemod funciona como una aplicación diferente en tu ordenador, que puede comunicarse con aplicaciones como Discord, pero son independientes. O si tienes tu Fortnite, igual. Ahora, estamos trabajando en integraciones para una fricción más baja y una experiencia más inmersiva", señala.
Este es uno de los propósitos de la ronda cerrada, empezar a generar un modelo de negocio sobre estas integraciones. Por lo pronto, han firmado un acuerdo con la china Tencent, que ya está distribuyendo la tecnología en sus plataformas. "Es un camino que acabamos de empezar y creemos que puede ser muy exitoso para nosotros, porque lo vemos formando parte de este ecosistema. Esto permitiría usar como fuente de tráfico aplicaciones con usuarios masivos", apunta el CEO de Voicemod.
La tecnológica también ha firmado acuerdos con compañías como Warner para incorporar voces y sonidos de franquicias de películas o series famosas. "Esto aún no está en el mercado, pero tenemos derechos para Rick y Morty o Batman, personajes de la cultura pop actual", señala Bosch. Ahora, la compañía cuenta con tres tipos de contenido distintos: Voicemod Originals, contenido de compañías como Warner, y used generated content, que es creado por los usuarios.
Aunque toda su progresión en inteligencia artificial abre la puerta a nuevos segmentos de usuarios, la mayoría de éstos siguen siendo gamers. "Los vemos como los early adopters de tecnología de la comunicación, aunque ahora tenemos un engagement más fuerte en gente que usa chats y mundos digitales", recalca. Sin embargo, todavía siguen muy pegados a este mundo del gaming, y a un usuario que, en más de un 40%, está ubicado en Estados Unidos.