Jie kuria programėlę, kuri keičia tarmes

Jiems tai tiesiog nebuvo prasminga. Jis laisvai kalbėjo anglų ir ispanų kalbomis, buvo labai draugiškas ir sistemų inžinerijos ekspertas. Kodėl jis negalėjo dirbti skambučių centre?

Draugas teigė, kad dėl jo akcento daugeliui klientų buvo sunku jį suprasti; Kai kurie net įžeidinėjo dėl to, kaip jis kalbėjo.

Trys mokiniai suprato, kad problema didesnė nei jų draugų patirtis. Taigi jie įkūrė startuolį, kad tai išspręstų.

Dabar jų įmonė „Sanas“ išbando dirbtiniu intelektu pagrįstą programinę įrangą, kuria siekiama pašalinti nesusipratimus realiuoju laiku keičiant žmonių akcentus. Pavyzdžiui, skambučių centro darbuotojas Filipinuose paprastai gali kalbėti į mikrofoną ir galiausiai atrodyti kaip kažkas iš KS ir klientui kitame gale.

Startuolio įkūrėjai sako, kad skambučių centrai yra tik pradžia. Bendrovės tinklalapyje jos planai apibūdinami kaip „pergalvotas pokalbis“.

Galiausiai jie tikisi savo kuriamos programos Juos naudos įvairios pramonės šakos ir asmenys. Jie sako, kad tai gali padėti gydytojams geriau suprasti pacientus arba padėti anūkams geriau suprasti savo senelius.

„Turime labai didelę Sanas viziją“, – sako generalinis direktorius Maksimas Serebryakovas.

O Serebryakovui ir jo įkūrėjams projektas yra asmeninis.

Jūs girdite ne žmonių balsus, kiek jų akcentus

Sanasą įkūrusi trijulė susitiko Stanfordo universitete, bet iš pradžių visi yra iš skirtingų šalių – Serebryakovas, dabar generalinis direktorius, iš Rusijos; Andrés Pérez Sodiri, dabartinis finansų direktorius, yra iš Venesuelos. ir Shun Zhang, dabar vyriausiasis technologijų pareigūnas, iš Kinijos.

Jie nebėra Stanfordo studentai. Serebryakovas ir Peresas baigė studijas; Changas pasitraukė, kad sutelktų dėmesį į Sanaso sugrąžinimą į gyvenimą.

Praėjusiais metais jie įkūrė įmonę, suteikdami jai pavadinimą, kurį būtų galima lengvai ištarti įvairiomis kalbomis, „kad pabrėžtume mūsų pasaulinę misiją ir norą suburti žmones“, – sako Perezas.

READ  Jūsų „Gmail“ ir nuotraukos gali būti ištrintos! Netrukus bus pradėtos naudoti naujos „Google“ taisyklės

Bėgant metams visi trys sako išbandę, kaip tarmės gali jiems trukdyti.

„Mes visi kilę iš tarptautinių sluoksnių, – sako Serebryakovas. – Iš pirmų lūpų matėme, kaip žmonės su jumis elgiasi skirtingai vien dėl to, kaip kalbate.” – Kartais skauda širdį.

Zhang sako, kad jo motina, kuri daugiau nei prieš 20 metų atvyko į JAV iš Kinijos, vis dar verčia jį kalbėtis su kasininke, kai jie kartu eina apsipirkti, nes jaučia gėdą.

„Tai viena iš priežasčių, kodėl prisijungiau prie Maxo ir Andrés kuriant šią įmonę ir stengiuosi padėti tiems žmonėms, kurie mano, kad jų balsai nėra girdimi tiek, kiek jų akcentai“, – sako jis.

Serebryakovas sako matęs, kaip su tėvais elgiamasi viešbučiuose, kai jie atvyksta pas jį į JAV – kaip žmonės daro prielaidas išgirdę jų akcentus.

„Jie kalba šiek tiek garsiau, – sako jis. – Jie keičia savo elgesį.”

Perezas pasakoja, kad, lankęs britų mokyklą, atvykęs į JAV jam iš pradžių sunkiai sekėsi suprasti Amerikos tarmes.

Ir nepradėkite nuo to, kas nutinka, kai jo tėtis bando naudoti „Amazon Alexa“, kurią šeima jam padovanojo Kalėdų proga.

„Greitai sužinojome, kad kai Alexa atsitiktinėse namų vietose įjungdavo šviesas ir nuspalvindavo jas rožine spalva, Alexa visiškai nesuprato mano tėčio akcento“, – sako Perezas.

Skambučių centrai išbando technologijas

Anglų kalba yra tTai labiausiai šnekama kalba pasaulyje. Apskaičiuota, kad ja kalba 1,5 milijardo žmonių – ir daugumai jų nėra gimtoji. Vien Jungtinėse Amerikos Valstijose milijonai žmonių kalba angliškai kaip antrąja kalba.

Tai sukūrė augančią programų, padedančių vartotojams lavinti anglų kalbos tarimą, rinką. Tačiau Sanas naudoja dirbtinį intelektą, siekdamas kitokio požiūrio.

READ  „Dungeons & Dragons“ skelbia kitą „evoliuciją“ būsimam žaidimui 2024 m

Prielaida: užuot išmokus tarti žodžius kitaip, technologijos gali tai padaryti už jus. Nebereikės brangių ar daug laiko reikalaujančių mokymų siekiant sumažinti akcentą. Ir supratimas bus beveik akimirksniu.

Serebryakovas sako žinąs, kad žmonių tarmės ir tapatybės gali būti glaudžiai susijusios, ir pabrėžia, kad bendrovė nesistengia ištrinti tarmių ar siūlyti, kad vienas kalbėjimo būdas yra geresnis už kitą.

„Mes leidžiame žmonėms nekeisti kalbėjimo būdo, kad užimtų pareigas, eitų darbą. Tapatybė ir dialektai yra labai svarbūs. Jie yra persipynę”, – sako jis. „Niekada nenori, kad kas nors pakeistų savo toną tik tam, kad kam nors patiktų“.

„Sanas“ algoritmas šiuo metu gali konvertuoti anglų kalbą į amerikiečių, australų, britų, filipiniečių, hindi ir ispanų dialektus ir iš jų, o komanda planuoja pridėti daugiau. Jie gali papildyti sistemą nauju tonu apmokydami neuroninį tinklą su profesionalių aktorių garso įrašais ir kitais duomenimis – procesas trunka kelias savaites.

Sanaso komanda suvaidino dvi CNN laidas. Viename buvo girdėti, kaip vyras su indišku akcentu skaitė eilę literatūrinių sakinių. Tada tos pačios frazės paverčiamos Amerikos dialektu:

Kitas pavyzdys su frazėmis, kurios gali būti dažnesnės skambučių centro sąrankoje, pvz., „Jei nurodysite savo vardą ir užsakymo numerį, galime pradėti taisyti už jus“.

Rezultatai su amerikietišku akcentu skamba šiek tiek dirbtinai ir integruoti, pavyzdžiui, virtualių asistentų balsai, tokie kaip Siri ir Alexa, tačiau Perezas sako, kad komanda stengiasi tobulinti technologiją.

„Tonas keičiasi, bet intonacija išsaugoma“, – sako jis. „Mes ir toliau dirbame siekdami, kad rezultatas būtų kuo natūralesnis, emocingesnis ir jaudinantis.

Perezas teigia, kad ankstyvieji atsiliepimai iš skambučių centrų, kurie išbandė šią technologiją, buvo teigiami. Taigi pateikite komentarus jų svetainėje, kai pasklinda žinia apie jų projektą.

Kaip startuolio įkūrėjai mato jo ateitį

Tai leido „Sanas“ padidinti darbuotojų skaičių. Dauguma Kalifornijoje įsikūrusios Palo Alto darbuotojų yra kilę iš tarptautinių šeimų. Tai nėra atsitiktinumas, sako Serebryakovas.

READ  The original Celeste now has a sequel that you can play in your browser

„Tai, ką statome, susilaukė daugybės žmonių, net ir mūsų samdomų žmonių atgarsio… Tikrai įdomu pamatyti“, – sako jis.

Įmonei augant gali praeiti šiek tiek laiko, kol „Sanas“ pasirodys „App Store“ arba šalia jūsų esančiame mobiliajame telefone.

Komanda teigia, kad šiuo metu dirba su didžiausiomis skambučių centrų užsakomųjų paslaugų įmonėmis ir renkasi lėtesnį diegimą individualiems vartotojams, kad jie galėtų tobulinti technologijas ir užtikrinti saugumą.

Šioje ekrano kopijoje parodyta, ką vartotojai mato „Sanas“ darbalaukio programoje.

Tačiau galiausiai jie tikisi, kad visi, kuriems to reikia, naudosis – ir kitose srityse.

Perezas įsivaizduoja, kad tai atlieka svarbų vaidmenį padedant žmonėms susisiekti su savo gydytojais.

„Bet kuri sekundė, prarasta dėl nesusipratimo dėl prarasto laiko ar neteisingų pranešimų, greičiausiai turės labai didelį poveikį“, – sako jis. „Mes tikrai norime, kad vertimo metu niekas neprarastų.

Pasak jo, vieną dieną tai taip pat galėtų padėti žmonėms išmokti kalbų, pagerinti filmų dubliavimą ir padėti išmaniesiems garsiakalbiams namuose bei balso padėjėjams automobiliuose suprasti skirtingus dialektus.

Ir ne tik anglų kalba – „Sanas“ komanda tikisi į algoritmą įtraukti ir kitų kalbų.

Trys įkūrėjai vis dar dirba ties detalėmis. Tačiau kaip ši technologija galėtų pagerinti ryšį ateityje, sako jie, nesunku suprasti.

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *