Stiri

Xiaomi dezvoltă tehnologie de redare a vocii

By Cristi

Posted on 19/05/2022

Xiaomi Mi TV LUX Transparent Edition

Chinezii de la Xiaomi au prezentat cea mai recentă aplicație de algoritmi avansați și tehnologie proprietară de redare a vocii, destinate publicului larg. Tehnologia Text-To-Speech în stil spontan este dezvoltată de Xiaomi AI Labs și folosită pentru a genera o voce unică și personalizată pentru un utilizator cu tulburări de vorbire.

Acesta poate comunica de acum cu ceilalți folosind „propria voce”, în locul vocii electronice monotone. Ca parte a proiectului de pre-cercetare “Own My Voice” condus de Xiaomi Technical Committee, această realizare de succes demonstrează angajamentul Xiaomi – “Tech for Good” (Tehnologie pentru bine) – și, totodată, misiunea companiei „de a le oferi tuturor oamenilor din lume posibilitatea să se bucure de o viață mai bună prin intermediul inovațiilor tehnologice”.

Cum a desfășurat Xiaomi proiectul?

Pentru a genera vocea cea mai potrivită și personalizată pentru beneficiar, echipa proiectului a recrutat peste 200 de voluntari din cadrul Xiaomi care și-au donat vocile. S-a folosit algoritmul de corelare al amprentei vocale pentru a sincroniza caracteristicile vocilor donate de voluntari cu cele ale destinatarului. Prin această abordare, s-au identificat cele mai potrivite sunete de bază ca sistem de referință pentru destinatar. S-a ținut cont și de reglementările de protecție a vieții private și, prin urmare, vocea aleasă a fost modificată printr-un procedeu acustic complex pentru a dezvolta un sunet nou și original.

Mai departe, s-a folosit tehnologia Text-To-Speech în stil spontan pentru a realiza modelul AI, iar noua voce a căpătat gradual ritm și intonație naturale pentru a exprima emoțiile și tonul uman.

Proiectul “Own My Voice” combină o varietate de algoritmi avansați cu tehnologia proprietară Xiaomi de viteză a discursului pentru a asigura specificitatea, siguranța și autenticitatea ridicată a vocii sintetizate. S-a creat astfel o nouă viziune asupra unui discurs personalizat pentru utilizatorii cu tulburări de vorbire.

Care este semnificația proiectului?

Un grup de experți în tehnologia vorbirii din cadrul Xiaomi AI Labs reprezintă coloana vertebrală a proiectului. Din 2017 și până acum, aceștia au publicat 37 de documente despre vorbire, prezentate la conferințe internaționale de top, cum ar fi Conferința Internațională despre Acustică, Vorbire și Procesarea Semnalului (ICASSP). Succesul proiectului “Own My Voice” depinde foarte mult de tehnologia Text-To-Speech în stil spontan dezvoltată de ei.

În esență, tehnologia Text-To-Speech în stil spontan face ca vocea sintetică să sune ca cea a unui om, din punct de vedere al intonației, pauzelor, vitezei și altor caracteristici. Cu ajutorul ei se înlocuiește vocea electronică monotonă și nenaturală. În prezent, această tehnologie se aplică mai multor dispozitive inteligente, echipate cu Xiaoai, asistentul vocal AI al Xiaomi. Proiectul “Own My Voice” demonstrează că tehnologia Text-To-Speech în stil spontan poate fi adoptată pe scară largă în zonele de accesabilitate și poate îmbunătăți experiența utilizatorilor.

Zhu Xi a adăugat: „Dacă observăm și ne adresăm nevoilor unor grupuri minoritare într-un stadiu incipient, procesul de difuzare a tehnologiei ar putea fi cu mult scurtat. Acest lucru permite ca beneficiile noilor tehnologii să devină accesibile utilizatorilor cu nevoi speciale, fără întârziere.”

În continuare, Xiaomi va primi feedback de la destinatarul vocii și va studia fezabilitatea proiectului la o scară mai largă. Xiaomi va continua să susțină accesul la cele mai noi tehnologii, cu scopul de a satisface nevoile diverse ale oamenilor prin inovarea tehnologică.