Projecte RAPNIC: Reconeixement Automàtic de la Parla No Intel·ligible en Català

Projecte RAPNIC: Reconeixement Automàtic de la Parla No Intel·ligible en Català

RAPNIC és un projecte de desenvolupament i entrenament d’un model d’Intel·ligència Artificial capaç de reconèixer Parles no Intel·ligibles en Català
(2025-2026)
Malgrat els avenços tecnològics, els sistemes de reconeixement de veu tenen encara dificultats significatives a l’hora d’identificar i interpretar patrons que s’allunyen dels estàndards, com en el cas de les anomenades “parles no intel·ligibles”. Això suposa que les persones amb trastorns de la parla, com ara la disàrtria, sovint no siguin enteses i no puguin accedir a eines tecnològiques que facilitarien la seva comunicació i autonomia. A més, les poques solucions existents es troben limitades a la llengua anglesa, fet que suposa una barrera addicional per a parlants d’altres idiomes, com el català.
El projecte RAPNIC (Reconeixement Automàtic de la Parla no Intel·ligible en Català) pretén donar resposta a aquesta necessitat, tot desenvolupant una solució d’Intel·ligència Artificial (IA) capaç de reconèixer i interpretar la parla no intel·ligible en català. Aquesta tecnologia permetrà que les persones amb trastorns de la parla puguin interactuar amb assistents de veu, sistemes de transcripció de veu a text o altres tecnologies digitals de manera eficaç, millorant així la seva autonomia i qualitat de vida.
Què és RAPNIC?
El projecte RAPNIC és una iniciativa pionera de la Fundació iSocial que busca eliminar una barrera tecnològica important per a les persones amb trastorns de la parla. A través de l’ús de la Intel·ligència Artificial (IA), RAPNIC té com a objectiu desenvolupar un sistema capaç de reconèixer i entendre la parla no intel·ligible, que actualment no és comprensible per als sistemes de reconeixement de veu.
Per aconseguir-ho, preveu la creació d’una base de dades de parla no intel·ligible en català, basada en enregistraments de veu de persones amb trastorns de la parla, amb un especial focus en la disàrtria, una alteració motora que afecta l’ús de la musculatura facial i dificulta la pronunciació de certs fonemes. Aquesta base de dades permetrà entrenar els algoritmes, mitjançant la tecnologia deep learning, en el reconeixement dels patrons sonors d’aquestes parles.

Durant la fase inicial del projecte, treballarem sobre un corpus format per enregistraments de persones amb síndrome de Down i paràlisi cerebral, ja que les seves parles solen presentar alteracions menors que altres tipus de disàrtria, cosa que facilitarà l’entrenament dels models d’IA. La base de dades inclourà un mínim de 100 hores enregistrades, i comptarà amb la participació de 120 persones voluntàries amb síndrome de Down i paràlisi cerebral, així com de professionals socials, logopedes, especialistes en models de deep learning i lingüistes computacionals.
L’objectiu final de RAPNIC és poder estendre aquest sistema, en primer lloc, a les 22.000 persones amb síndrome de Down i paràlisi cerebral que es troben en el domini lingüístic català, i, en una segona fase del projecte, al conjunt de 49.000 persones amb trastorns de la parla en el domini lingüístic català, incloent-hi aquelles que pateixen alteracions més greus.
RAPNIC permetrà a les persones afectades per trastorns de parla comunicar-se de manera més eficaç amb les persones del seu entorn, donar ordres a assistents de veu, transcriure la seva veu a text, o interactuar amb altres serveis digitals de manera més independent.
Premi CSC Impulsa 2024
El Projecte RAPNIC ha estat reconegut com a guanyador dels Premis CSC Impulsa 2024 en la categoria “Projectes Innovadors d’IA en l’àmbit social”.
El reconeixement atorgat pel Consorci de Salut i Social de Catalunya (CSC), que inclou un suport econòmic de 20.000 euros i l’acompanyament tècnic del Consorci, serà decisiu per convertir aquesta iniciativa en una realitat tangible.

Objectius del projecte
RAPNIC es proposa aconseguir els següents objectius clau:
- Desenvolupar un corpus de dades obertes de parla no intel·ligible en català, amb gravacions de veu de persones afectades per trastorns de la parla, com les persones amb síndrome de Down i paràlisi cerebral.
- Crear un model d’intel·ligència artificial per al reconeixement de la parla no intel·ligible, millorant l’accessibilitat i la inclusió digital de les persones amb trastorns de la parla.
- Posar a disposició del públic una aplicació en línia perquè qualsevol persona amb trastorns de la parla pugui provar el model i comprovar-ne l’eficàcia en la transcripció del discurs.
- Posar a disposició de les empreses tecnològiques el corpus de dades obertes, perquè les eines de reconeixement automàtic de la parla catalana que ja hi ha al mercat incorporin el reconeixement de les parles no intel·ligibles.
- Elaborar una publicació científica que detalli el procés de recollida de dades i els resultats. Aquesta publicació serà presentada a una conferència internacional de Processament del Llenguatge Natural (PLN), proporcionant una visió de les metodologies utilitzades i contribuint a la disseminació del coneixement adquirit.
Impactes i millores esperats
RAPNIC té un gran potencial per millorar la vida de les persones amb trastorns de la parla, facilitant la seva interacció amb les tecnologies digitals i afavorint la seva inclusió social. Els principals beneficis esperats inclouen:
- Millora de l’autonomia de les persones amb trastorns de la parla, especialment de les més de 22.000 persones amb alteracions de la parla lleu que parlen català, que tindran accés a assistents de veu, a eines de subtitulació de la veu i transcripció automàtiques i a altres serveis digitals dels quals actualment no es poden servir.
- Millora de l’accessibilitat i de comunicació de les persones afectades de trastorns de la parla, que podran accedir a les mateixes eines digitals que la resta de la població, amb la seguretat que les seves necessitats específiques seran ateses.
- Reducció de la bretxa digital que afecta les persones amb trastorns de la parla, especialment aquelles que pateixen altres afectacions motores.
- Creació d’un corpus de dades que permetrà als investigadors continuar entrenant models de codi obert en català, i a les empreses oferir eines digitals que incloguin el reconeixement de parles no intel·ligibles.
- Desenvolupament d’un model i una metodologia que, en el futur, podran aplicar-se a altres trastorns de la parla més greus (ictus, lesions cerebrals…) i adaptar-se a altres llengües.
Lidera:

Socis:








Amb el suport de:

Projectes d’innovació