RAPNIC: Reconocimiento automático del habla no fluida en catalán

RAPNIC: Reconocimiento automático del habla no fluida en catalán

RAPNIC es un proyecto de desarrollo y entrenamiento de un modelo de Inteligencia Artificial (IA) capaz de reconocer el habla no fluida en catalán
(2025-2026)
A pesar de los avances tecnológicos, los sistemas de reconocimiento de voz todavía tienen dificultades significativas a la hora de identificar e interpretar patrones que se alejan de los estándares, como en el caso de las llamadas “hablas no fluidas”. Esto supone que las personas con trastornos del habla, como la disartria, a menudo no sean entendidas y no puedan acceder a herramientas tecnológicas que facilitarían su comunicación y autonomía. Además, las pocas soluciones existentes están limitadas al idioma inglés, lo que supone una barrera adicional para los hablantes de otras lenguas, como el catalán.
El proyecto RAPNIC pretende dar respuesta a esta necesidad, desarrollando una solución de Inteligencia Artificial (IA) capaz de reconocer e interpretar hablas no fluidas en catalán. Esta tecnología permitirá que las personas con trastornos del habla puedan interactuar con asistentes de voz, sistemas de transcripción de voz a texto u otras tecnologías digitales de manera eficaz, mejorando así su autonomía y calidad de vida.
¿Qué es RAPNIC?
RAPNIC es una iniciativa pionera de la Fundación iSocial que busca eliminar una barrera tecnológica importante para las personas con trastornos del habla. A través del uso de la Inteligencia Artificial (IA), RAPNIC tiene como objetivo desarrollar un sistema capaz de reconocer y comprender el habla no fluida, que actualmente no es comprensible para los sistemas de reconocimiento de voz.
Para lograrlo, el proyecto ha creado una base de datos de habla no fluida en catalán, a partir de grabaciones de personas con trastornos del habla, con un enfoque especial en la disartria, un trastorno motor que afecta la musculatura facial y dificulta la pronunciación de ciertos fonemas. Esta base de datos servirá para entrenar los algoritmos de IA mediante tecnología de deep learning, permitiendo el reconocimiento de los patrones sonoros de estas hablas.

En la fase inicial del proyecto, se trabajará con un corpus de grabaciones de personas con síndrome de Down y parálisis cerebral, ya que sus patrones de habla suelen presentar menos alteraciones que otras formas de disartria, lo que facilitará el entrenamiento de los modelos de IA. La base de datos incluirá un mínimo de 25 horas de grabaciones y contará con la participación de 100 personas voluntarias con síndrome de Down y parálisis cerebral provinientes de 9 entidades distintas, así como profesionales del ámbito social, logopedas, especialistas en deep learning y lingüistas computacionales.
El objetivo final de RAPNIC es extender este sistema, en primer lugar, a las 22.000 personas con síndrome de Down y parálisis cerebral que forman parte del ámbito lingüístico catalán y, en una segunda fase, a las 49.000 personas con trastornos del habla dentro de esta comunidad lingüística, incluyendo aquellas con otro tipo de alteraciones. RAPNIC permitirá que las personas afectadas por trastornos del habla se comuniquen de manera más eficaz con su entorno, den órdenes a asistentes de voz, transcriban su habla a texto e interactúen con otros servicios digitales de forma más autónoma.
Premio CSC Impulsa 2024
El Proyecto RAPNIC ha sido galardonado con el Premio CSC Impulsa 2024 en la categoría “Proyectos Innovadores de IA en el ámbito social”.
Este reconocimiento, otorgado por el Consorcio de Salud y Social de Cataluña (CSC), incluye un apoyo económico de 20.000 euros y el acompañamiento técnico del consorcio, lo que será clave para convertir esta iniciativa en una realidad tangible.

Objetivos del Proyecto
RAPNIC se propone alcanzar los siguientes objetivos clave:
- Desarrollar un corpus de datos abiertos de habla no fluida en catalán, basado en grabaciones de personas con trastornos del habla, como aquellas con síndrome de Down y parálisis cerebral.
- Crear un modelo de inteligencia artificial para el reconocimiento del habla no fluida, mejorando la accesibilidad e inclusión digital de las personas con trastornos del habla.
- Elaborar una publicación científica que detalle el proceso de recopilación de datos y los resultados, proporcionando una visión de las metodologías utilizadas y contribuyendo a la difusión del conocimiento adquirido.
Impactos y mejoras esperadas
RAPNIC tiene un gran potencial para mejorar la vida de las personas con trastornos del habla, facilitando su interacción con las tecnologías digitales y favoreciendo su inclusión social. Los principales beneficios esperados incluyen:
- Mejora de la autonomía de las personas con trastornos del habla, que en el ámbito catalán constituyen cerca de 49.000 personas. Gracias a la bsae de datos generada, estas personas podrán tener acceso a asistentes de voz, herramientas de subtitulación de voz y transcripción automática, y otros servicios digitales de los que actualmente no pueden beneficiarse.
- Mejora de la accesibilidad y la comunicación de las personas afectadas por trastornos del habla, que podrán acceder a las mismas herramientas digitales que el resto de la población, con la seguridad de que sus necesidades específicas serán atendidas.
- Reducción de la brecha digital que afecta a las personas con trastornos del habla, especialmente aquellas que padecen otras afectaciones motoras.
- Creación de un corpus de datos que permitirá a los investigadores continuar entrenando modelos de código abierto en catalán.
- Desarrollo de un modelo y una metodología que, en el futuro, podrán aplicarse a otros trastornos del habla (ictus, lesiones cerebrales…) y adaptarse a otros idiomas.
Lidera:

Socios:










Con el apoyo de:

Projectes d’innovació






