8 aprilie 2023

Au apărut ochelarii inteligenți, care „văd” cuvintele persoanelor mute

Vești bune pentru persoanele cu dificultăți de vorbire: o echipă de cercetători a dezvoltat niște ochelari inteligenți, care promit să ajute la îmbunătățirea comunicării persoanelor mute sau cu dificultăți de vorbire. Aceștia sunt legați la o interfață de recunoaștere a vorbirii silențioase ce utilizează detectarea acustică și inteligența artificială pentru a recunoaște până la 31 de comenzi nevorbite, pe baza mișcărilor buzelor și ale gurii.

Interfața portabilă, botezată EchoSpeech și dezvoltată de o echipă de cercetători de la Cornell, necesită doar câteva minute de date de antrenament pentru utilizator înainte de a recunoaște comenzile și poate fi rulată pe un telefon inteligent.Â

„Pentru persoanele care nu pot vocaliza sunete, această tehnologie pentru vorbirea silențioasă ar putea fi un input excelent pentru un sintetizator de voce. Ar putea să le redea vocea pacienților”, a declarat Ruidong Zhang, doctorand în știința informației și autorul principal al lucrării, despre potențialul de utilizare a tehnologiei în dezvoltări ulterioare.

În forma sa actuală, EchoSpeech ar putea fi utilizat pentru a comunica cu alte persoane prin intermediul unui smartphone în locuri în care vorbitul este incomod sau nepotrivit, cum ar fi un restaurant zgomotos sau o bibliotecă liniștită.

Mai mult, interfața vocală silențioasă poate fi, de asemenea, cuplată cu un stilou și utilizată cu un software de proiectare, cum ar fi CAD, eliminând practic necesitatea unei tastaturi și a unui mouse. Dotați cu o pereche de microfoane și difuzoare mai mici decât o gumă de șters, ochelarii EchoSpeech devin un sistem sonar portabil alimentat de inteligența artificială, care trimite și primește unde sonore și detectează mișcări ale corpului, feței și gurii. Un algoritm de învățare profundă analizează apoi aceste profile în timp real, cu o precizie de aproximativ 95%.

Suntem foarte încântați de ceea ce am creat. Este un dispozitiv mic, are un consum redus de energie și este sensibil la confidențialitate, toate acestea fiind caracteristici importante pentru implementarea de noi tehnologii purtabile în lumea reală, spun autorii. Majoritatea tehnologiilor de recunoaștere a vorbirii silențioase se limitează la un set de comenzi prestabilite și necesită ca utilizatorul să se afle cu fața sau să poarte o cameră, ceea ce nu este nici practic, nici fezabil, spune Cheng Zhang.

Există, de asemenea, preocupări majore legate de confidențialitate care folosesc camerele portabile, atât pentru utilizator, cât și pentru cei cu care acesta interacționează.

Tehnologiile de detectare acustică, precum EchoSpeech, elimină necesitatea camerelor video portabile, iar datele audio necesită o lățime de bandă mai mică pentru a fi procesate și pot fi transmise în timp real către un smartphone prin Bluetooth, a declarat François Guimbretière, profesor în știința informației.

Și pentru că datele sunt procesate local, pe smartphone, în loc să fie încărcate în cloud, „informațiile sensibile din punct de vedere al confidențialității sunt în controlul vorbitorilor”, potrivit profesorului. Mai mult, durata de viață a bateriei se îmbunătățește, de asemenea, exponențial, a spus Cheng Zhang: Zece ore cu detecție acustică față de 30 de minute cu o cameră.

Un articol despre acest dispozitiv a fost publicat joi, în jurnalul universității, Cornell Chronicle.

Ochelarii vor fi prezentați la conferința Societății pentru dispozitive computaționale privind factorii umani în sistemele informatice (CHI), care va avea loc luna aceasta la Hamburg, în Germania.

Foto: Ruidong Zhang, a doctoral student in the field of information science, wearing EchoSpeech glasses

Sursa

Categorii: Breaking Medika, Știri