Proyecto RAPNIC: Reconocimiento Automático del Habla No Inteligible en Catalán

Proyecto RAPNIC: Reconocimiento Automático del Habla No Inteligible en Catalán

RAPNIC es un proyecto de desarrollo y entrenamiento de un modelo de Inteligencia Artificial (IA) capaz de reconocer el habla no inteligible en catalán
(2025-2026)
A pesar de los avances tecnológicos, los sistemas de reconocimiento de voz todavía tienen dificultades significativas a la hora de identificar e interpretar patrones que se alejan de los estándares, como en el caso de las llamadas “hablas no inteligibles”. Esto supone que las personas con trastornos del habla, como la disartria, a menudo no sean entendidas y no puedan acceder a herramientas tecnológicas que facilitarían su comunicación y autonomía. Además, las pocas soluciones existentes están limitadas al idioma inglés, lo que supone una barrera adicional para los hablantes de otras lenguas, como el catalán.
El proyecto RAPNIC (Reconocimiento Automático del Habla No Inteligible en Catalán) pretende dar respuesta a esta necesidad, desarrollando una solución de Inteligencia Artificial (IA) capaz de reconocer e interpretar el habla no inteligible en catalán. Esta tecnología permitirá que las personas con trastornos del habla puedan interactuar con asistentes de voz, sistemas de transcripción de voz a texto u otras tecnologías digitales de manera eficaz, mejorando así su autonomía y calidad de vida.
¿Qué es RAPNIC?
RAPNIC es una iniciativa pionera de la Fundación iSocial que busca eliminar una barrera tecnológica importante para las personas con trastornos del habla. A través del uso de la Inteligencia Artificial (IA), RAPNIC tiene como objetivo desarrollar un sistema capaz de reconocer y comprender el habla no inteligible, que actualmente no es comprensible para los sistemas de reconocimiento de voz.
Para lograrlo, el proyecto prevé la creación de una base de datos de habla no inteligible en catalán, a partir de grabaciones de personas con trastornos del habla, con un enfoque especial en la disartria, un trastorno motor que afecta la musculatura facial y dificulta la pronunciación de ciertos fonemas. Esta base de datos servirá para entrenar los algoritmos de IA mediante tecnología de deep learning, permitiendo el reconocimiento de los patrones sonoros de estas hablas.

En la fase inicial del proyecto, se trabajará con un corpus de grabaciones de personas con síndrome de Down y parálisis cerebral, ya que sus patrones de habla suelen presentar menos alteraciones que otras formas de disartria, lo que facilitará el entrenamiento de los modelos de IA. La base de datos incluirá un mínimo de 100 horas de grabaciones y contará con la participación de 120 personas voluntarias con síndrome de Down y parálisis cerebral, así como profesionales del ámbito social, logopedas, especialistas en deep learning y lingüistas computacionales.
El objetivo final de RAPNIC es extender este sistema, en primer lugar, a las 22.000 personas con síndrome de Down y parálisis cerebral que forman parte del ámbito lingüístico catalán y, en una segunda fase, a las 49.000 personas con trastornos del habla dentro de esta comunidad lingüística, incluyendo aquellas con alteraciones más graves. RAPNIC permitirá que las personas afectadas por trastornos del habla se comuniquen de manera más eficaz con su entorno, den órdenes a asistentes de voz, transcriban su habla a texto e interactúen con otros servicios digitales de forma más autónoma.
Premio CSC Impulsa 2024
El Proyecto RAPNIC ha sido galardonado con el Premio CSC Impulsa 2024 en la categoría “Proyectos Innovadores de IA en el ámbito social”.
Este reconocimiento, otorgado por el Consorcio de Salud y Social de Cataluña (CSC), incluye un apoyo económico de 20.000 euros y el acompañamiento técnico del consorcio, lo que será clave para convertir esta iniciativa en una realidad tangible.

Objetivos del Proyecto
RAPNIC se propone alcanzar los siguientes objetivos clave:
- Desarrollar un corpus de datos abiertos de habla no inteligible en catalán, basado en grabaciones de personas con trastornos del habla, como aquellas con síndrome de Down y parálisis cerebral.
- Crear un modelo de inteligencia artificial para el reconocimiento del habla no inteligible, mejorando la accesibilidad e inclusión digital de las personas con trastornos del habla.
- Poner a disposición del público una aplicación en línea para que cualquier persona con trastornos del habla pueda probar el modelo y comprobar su eficacia en la transcripción del discurso.
- Poner a disposición de las empresas tecnológicas el corpus de datos abiertos, para que las herramientas de reconocimiento automático del habla catalana que ya existen en el mercado incorporen el reconocimiento de las hablas no inteligibles.
- Elaborar una publicación científica que detalle el proceso de recopilación de datos y los resultados. Esta publicación será presentada en una conferencia internacional de Procesamiento del Lenguaje Natural (PLN), proporcionando una visión de las metodologías utilizadas y contribuyendo a la difusión del conocimiento adquirido.
Impactos y mejoras esperadas
RAPNIC tiene un gran potencial para mejorar la vida de las personas con trastornos del habla, facilitando su interacción con las tecnologías digitales y favoreciendo su inclusión social. Los principales beneficios esperados incluyen:
- Mejora de la autonomía de las personas con trastornos del habla, especialmente de las más de 22.000 personas con alteraciones del habla leves que hablan catalán, que tendrán acceso a asistentes de voz, herramientas de subtitulación de voz y transcripción automática, y otros servicios digitales de los que actualmente no pueden beneficiarse.
- Mejora de la accesibilidad y la comunicación de las personas afectadas por trastornos del habla, que podrán acceder a las mismas herramientas digitales que el resto de la población, con la seguridad de que sus necesidades específicas serán atendidas.
- Reducción de la brecha digital que afecta a las personas con trastornos del habla, especialmente aquellas que padecen otras afectaciones motoras.
- Creación de un corpus de datos que permitirá a los investigadores continuar entrenando modelos de código abierto en catalán, y a las empresas ofrecer herramientas digitales que incluyan el reconocimiento de hablas no inteligibles.
- Desarrollo de un modelo y una metodología que, en el futuro, podrán aplicarse a otros trastornos del habla más graves (ictus, lesiones cerebrales…) y adaptarse a otros idiomas.
Lidera:

Socios:








Con el apoyo de:

Projectes d’innovació