Ny teknik hjälper AI tolka vad du känner och hur du mår genom din röst

AI-analys av hur vi talar kan identifiera allt från Parkinsons sjukdom till social bakgrund. Men att tekniken flyttar in i våra vardagsrum innebär risker.

Porträtt av Tom Bäckström. — Tom Bäckström vid Aalto-universitetet arbetar med frågor kring AI, talteknologin och den mänskliga rösten. Bild: Janne Lindroos / Yle

Victoria Wirén

18.2 05:30

Artificiell intelligens och talteknologi utvecklas i snabb takt för att styra apparater, och för att ge oss bättre service på webben och via telefon.

Ju mer vi pratar med våra apparater desto mer berättar vi om oss själva, både medvetet och omedvetet.

– Det finns väldigt mycket information i talrösten. Hälsotillstånd, social bakgrund, utbildningsnivå och preferenser, säger professor Tom Bäckström vid Aalto-universitetet.

Artificiell intelligens kan till exempel känna igen om det är ett barn eller en vuxen som pratar, och om personen är glad och ivrig eller trött och ledsen.

Med hjälp av AI kan man anpassa tjänster så att de speglar användaren, till exempel när det gäller språklig nivå. Målet är att tjänsterna upplevs som trevliga och lätta att använda.

AI kan känna igen en sjuk röst

AI kan också identifiera neurologiska sjukdomar.

– Eftersom rösten är en finmotorisk process behövs fungerande muskelkontroll för att prata. Avvikelser är inget som en läkare kan höra, men datorerna kan i dag ganska bra veta om du har Parkinsons sjukdom eller inte.

Bäckström pekar på riskerna med att den här sortens analyser görs av andra än läkare.

– Om ett av de stora företagen börjar sälja den här teknologin exempelvis till banker, försäkringsbolag och reklambranschen kan teknologin användas oetiskt.

Om AI konstaterar att en person är sjuk kan det till exempel leda till svårigheter att få banklån eller försäkringar.

AI kan också göra misstag och felaktigt klassificera friska personer som sjuka.

Bara nödvändig information

Också myndigheter kan använda tekniken oetiskt, till exempel i politiskt syfte.

– Olika etniska grupper kunde i större omfattning bli spårade och förföljda när man kan identifiera olika grupper automatiskt genom talrösten, säger Bäckström.

För att skydda vår integritet är det därför viktigt att AI-tjänster bara analyserar den information som verkligen behövs för att servicen ska fungera.

Det betyder att man filtrerar bort andra faktorer som kan utgöra en risk för användarnas integritet.

Enligt Tom Bäckström är det här en fråga som både konsumenter och lagstiftare borde fästa större uppmärksamhet vid. Hur vill vi ha det och hur ska vi se till att både minimera riskerna och dra nytta av tekniken?

Bara relevant information ska analyseras:

Grafik: Max Rantakangas/Yle

Bäckström jämför riskerna med Cambridge Analytica-skandalen år 2018.

– Då fick de via Facebook en massa information för politiskt bruk. Jag tror att talanvändargränssnitt har lika stor potential för risker i politiska sammanhang.

Bäckström säger ändå att det i dagens läge inte finns någon akut risk för att det här skulle ske. På sikt är det här ändå något man måste beakta.

– Just nu är jag inte orolig, men jag är lite orolig över hur det går om fem, tio år, säger Bäckström.

Apparaterna lyssnar på dig

Om utvecklingen av artificiell intelligens och talteknik fortsätter i samma takt som nu får vi mer och mer övergå till att ge kommandon i stället för att trycka på många knappar för att få våra apparater att fungera.

Det betyder också att vi har flera mikrofoner som lyssnar på oss i väntan på eventuella kommandon.

Enligt Tom Bäckström är det här inget problem, så länge vi vet var vi blir avlyssnade och hur informationen används.

Dilemmat är att vi ofta saknar den informationen. Han understryker behovet av tydligare lagstiftning och bättre teknisk design.

– Vi har lagar som GDPR och AI-förordningen i EU, men det är oklart hur väl de följs i praktiken och många vet inte hur mycket information som faktiskt går att utvinna ur en röst, säger han.

Enligt Bäckström måste både teknikutvecklare och lagstiftare bli bättre på att informera användare om när data samlas in och hur den används.

– Det finns inget interface som berättar när ljud går ut eller inte. På laptoppens kamera brukar det finnas en liten lampa som lyser när kameran är på. Men telefonen har inget sådant system där man vet när den lyssnar eller inte.

Eftersom också en mikrofon i rummet bredvid kan snappa upp det som sägs kanske det inte räcker med en blinkande lampa.

– Då kanske någon sorts ljudsignal kunde behövas. Det här har vi ännu ingen lösning på, säger Bäckström.

Bra att kontrollera inställningarna

Hemma i vardagsrummet kan en smart-tv förmedla information via mikrofon och kamera. Den som ställer in tv:n kan välja vilka inställningar hen vill ha och berätta om det för familjen eller andra som vistas i utrymmet.

När det kommer gäster borde de egentligen också informeras om vilken information familjens tv eller andra apparater kan samla in, men Bäckström konstaterar att han åtminstone aldrig har varit med om att någon skulle ha gjort det.

För konsumenten är det bra att veta att det kan löna sig att kontrollera inställningarna för att försäkra sig om att utomstående inte kommer åt privat information.

Tom Bäckström vill ändå understryka att det finns stor potential i AI och talteknik.

– Det handlar om att hitta en balans. Privatlivet är alltid en balansgång, det är inte svart eller vitt.