Број апликација и значај гласовних интерфејса брзо расте

Садржина

велика четворка
Американци желе да купе
Оперите, испеците, очистите!
Стари концепт. Да ли је коначно дошло њено време?
технички тешко питање
Глас? Графичка уметност? Или можда обоје?
Пазите на безбедност!

Америчка породица у Портланду, Орегон, недавно је сазнала да је Алексов гласовни асистент снимио њихове приватне разговоре и послао их пријатељу. Власница куће, коју су медији прозвали Данијела, рекла је новинарима да "никада више неће укључити тај уређај јер јој се не може веровати".

Алека, коју обезбеђују Ецхо (1) звучници и други уређаји у десетинама милиона америчких домова, почиње да снима када чује своје име или „позивну реч“ коју је изговорио корисник. То значи да чак и ако се реч „Алека“ помиње у ТВ реклами, уређај може да почне да снима. Управо то се догодило у овом случају, каже Амазон, дистрибутер хардвера.

„Остатак разговора је гласовни асистент протумачио као команду за слање поруке“, наводи се у саопштењу компаније. „У неком тренутку, Алекса је гласно упитала: „Коме? Наставак породичног разговора о паркету од тврдог дрвета машина је требало да схвати као ставку на листи контаката купца.” Барем тако мисли Амазон. Тако се превод своди на низ удеса.

Анксиозност, међутим, остаје. Јер из неког разлога, у кући у којој смо се још увек осећали опуштено, морамо да уђемо у неку врсту „гласовног режима“, да гледамо шта причамо, шта ТВ емитује и, наравно, шта овај нови звучник на грудима фиоке каже . нас.

Међутим, Упркос несавршености технологије и забринутости за приватност, са порастом популарности уређаја као што је Амазон Ецхо, људи почињу да се навикавају на идеју да комуницирају са рачунарима користећи свој глас..

Као што је Вернер Вогелс, технички директор Амазона, приметио током своје АВС ре:Инвент сесије крајем 2017. године, технологија је до сада ограничавала нашу способност интеракције са рачунарима. Укуцамо кључне речи у Гугл помоћу тастатуре, јер је то и даље најчешћи и најлакши начин за унос информација у машину.

рекао је Вогелс. -

велика четворка

Када смо користили Гоогле претраживач на телефону, вероватно смо одавно приметили знак микрофона са позивом за разговор. Ово Гоогле одмах (2), који се може користити за диктирање упита за претрагу, уношење поруке гласом, итд. Последњих година, Гоогле, Аппле и Амазон су се знатно побољшали технологија за препознавање гласа. Гласовни асистенти као што су Алека, Сири и Гоогле Ассистант не само да снимају ваш глас, већ и разумеју шта им кажете и одговарају на питања.

Гоогле тренутно је бесплатно доступан свим Андроид корисницима. Апликација може, на пример, да подеси аларм, провери временску прогнозу и провери руту на Гугл мапама. Конверзацијски наставак за Гоогле тренутно стање Гоогле помоћник () – виртуелна помоћ кориснику опреме. Доступан је углавном на мобилним и паметним кућним уређајима. За разлику од Гоогле тренутно, може да учествује у двосмерној размени. Помоћник је дебитовао у мају 2016. као део Гоогле апликације за размену порука Алло, као и у Гоогле Хоме гласовном звучнику (3).

3. Гоогле Хоме

ИОС систем такође има свог виртуелног асистента, сири, који је програм укључен у Апплеове оперативне системе иОС, ватцхОС, твОС хомепод и мацОС. Сири је дебитовао са иОС 5 и иПхоне 4с у октобру 2011. на Лет'с Талк иПхоне конференцији.

Софтвер је заснован на конверзацијском интерфејсу: препознаје природни говор корисника (са иОС 11 је могуће и ручно уносити команде), одговара на питања и завршава задатке. Захваљујући увођењу машинског учења, временом асистент анализира личне преференције корисник да пружи релевантније резултате и препоруке. Сири захтева сталну интернет везу – главни извори информација овде су Бинг и Волфрам Алпха. иОС 10 је увео подршку за екстензије трећих страна.

Још један од велике четворке Цортана. То је интелигентни лични асистент који је креирао Мицрософт. Подржан је на платформама Виндовс 10, Виндовс 10 Мобиле, Виндовс Пхоне 8.1, Ксбок Оне, Скипе, Мицрософт Банд, Мицрософт Банд 2, Андроид и иОС. Цортана је први пут представљена на Мицрософт Буилд Девелопер конференцији у априлу 2014. у Сан Франциску. Назив програма потиче од имена лика из серије Хало игрица. Цортана је доступна на енглеском, италијанском, шпанском, француском, немачком, кинеском и јапанском.

Корисници већ поменутог програма Алека морају узети у обзир и језичка ограничења – дигитални асистент говори само енглески, немачки, француски и јапански.

Амазон Виртуал Ассистант је први пут коришћен у паметним звучницима Амазон Ецхо и Амазон Ецхо Дот које је развио Амазон Лаб126. Омогућава гласовну интеракцију, репродукцију музике, креирање листе обавеза, подешавање аларма, стримовање подкаста, репродукцију аудио књига и информације о времену, саобраћају, спорту и другим вестима у реалном времену, као што су вести (4). Алека може да контролише више паметних уређаја за креирање система кућне аутоматизације. Такође се може користити за згодну куповину у Амазон продавници.

4. За шта корисници користе Ецхо (према истраживању)

Корисници могу побољшати Алека искуство инсталирањем Алека „скиллс“ (), додатних функција које су развиле треће стране, које се у другим поставкама чешће називају апликацијама као што су временске прилике и аудио програми. Већина Алека уређаја вам омогућава да активирате виртуелног помоћника помоћу лозинке за буђење, која се зове .

Амазон данас дефинитивно доминира тржиштем паметних звучника (5). ИБМ, који је увео нову услугу у марту 2018. године, покушава да уђе у прва четири Вотсонов помоћник, дизајниран за компаније које желе да креирају сопствене системе виртуелних асистената са гласовном контролом. Која је предност ИБМ решења? Према речима представника компаније, пре свега на много већим могућностима персонализације и заштите приватности.

Прво, Ватсон Ассистант није брендиран. Компаније могу креирати сопствена решења на овој платформи и означити их сопственим брендом.

Друго, они могу да тренирају своје помоћне системе користећи сопствене скупове података, за које ИБМ каже да олакшава додавање функција и команди том систему него друге технологије ВУИ (гласовни кориснички интерфејс).

Треће, Ватсон Ассистант не пружа ИБМ-у информације о активностима корисника – програмери решења на платформи могу само да задрже вредне податке за себе. У међувремену, свако ко прави уређаје, на пример са Алека-ом, треба да буде свестан да ће њихови вредни подаци завршити на Амазону.

Ватсон Ассистант већ има неколико имплементација. Систем је користио, на пример, Харман, који је креирао гласовног асистента за концептни аутомобил Масерати (6). На аеродрому у Минхену, помоћник ИБМ-а покреће Пеппер робота како би помогао путницима да се крећу. Трећи пример је Цхамелеон Тецхнологиес, где се гласовна технологија користи у паметном кућном мерачу.

6. Вотсон асистент у концептном аутомобилу Масерати

Вреди додати да основна технологија овде такође није нова. Ватсон Ассистант укључује могућности шифровања за постојеће ИБМ производе, Ватсон Цонверсатион и Ватсон Виртуал Агент, као и АПИ-је за анализу језика и ћаскање.

Амазон није само лидер у технологији паметног гласа, већ је претвара у директан посао. Међутим, неке компаније су експериментисале са Ецхо интеграцијом много раније. Сисенсе, компанија из БИ и аналитичке индустрије, представила је Ецхо интеграцију у јулу 2016. Заузврат, стартап Роки је одлучио да креира сопствени софтвер и хардвер који се контролише гласом за угоститељску индустрију. Раније ове године, Синкк је представио апликацију за прављење белешки која користи обраду гласа и природног језика за додавање белешки и уноса календара без потребе да их куцате на тастатури.

Сва ова мала предузећа имају високе амбиције. Највише од свега су, међутим, сазнали да не жели сваки корисник да преноси своје податке на Амазон, Гугл, Епл или Мајкрософт, који су најважнији играчи у изградњи платформи за гласовну комуникацију.

Американци желе да купе

У 2016. гласовна претрага је чинила 20% свих Гоогле мобилних претрага. Људи који свакодневно користе ову технологију наводе њену погодност и мултитаскинг међу њеним највећим предностима. (на пример, могућност коришћења претраживача док возите аутомобил).

Аналитичари компаније Висионгаин процењују тренутну тржишну вредност паметних дигиталних асистената на 1,138 милијарди долара Таквих механизама је све више. Према Гартнеру, већ до краја 2018 30% наших интеракција са технологијом ће бити кроз разговоре са гласовним системима.

Британска истраживачка компанија ИХС Маркит процењује да ће тржиште дигиталних асистената са вештачком интелигенцијом достићи 4 милијарде уређаја до краја ове године, а тај број би могао да порасте на 2020 милијарди до 7. године.

Према извештајима еМаркетера и ВоицеЛабс-а, 2017 милиона Американаца користило је гласовну контролу најмање једном месечно у 35,6. То значи повећање од скоро 130% у односу на претходну годину. Очекује се да ће само тржиште дигиталних асистената порасти до 2018% у 23. То значи да ћете их већ користити. 60,5 милиона Американаца, што ће резултирати конкретним новцем за њихове произвођаче. РБЦ Цапитал Маркетс процењује да ће Алека интерфејс генерисати до 2020 милијарди долара прихода за Амазон до 10.

Оперите, испеците, очистите!

Гласовни интерфејси све храбрије улазе на тржишта кућних апарата и потрошачке електронике. То се већ могло видети током прошлогодишње изложбе ИФА 2017. Америчка компанија Неато Роботицс представила је, на пример, робот-усисивач који се повезује на једну од неколико платформи за паметне куће, укључујући систем Амазон Ецхо. Разговарајући са Ецхо паметним звучником, можете да упутите машини да очисти целу вашу кућу у одређено доба дана или ноћи.

На изложби су представљени и други производи који се активирају гласом, од паметних телевизора које под брендом Тосхиба продаје турска компанија Вестел до грејних ћебади немачке компаније Беурер. Многи од ових електронских уређаја такође се могу активирати даљински помоћу паметних телефона.

Међутим, према речима представника Боша, прерано је рећи која ће од опција домаћег помоћника постати доминантна. На ИФА 2017, немачка техничка група је представила машине за прање веша (7), пећнице и машине за кафу које се повезују на Ецхо. Босцх такође жели да његови уређаји буду компатибилни са Гоогле и Аппле гласовним платформама у будућности.

7. Босцх машина за прање веша која се повезује на Амазон Ецхо

Компаније као што су Фујитсу, Сони и Панасониц развијају сопствена решења гласовног помоћника заснована на вештачкој интелигенцији. Схарп додаје ову технологију пећницама и малим роботима који улазе на тржиште. Ниппон Телеграпх & Телепхоне ангажује произвођаче хардвера и играчака да прилагоде систем вештачке интелигенције који се контролише гласом.

Стари концепт. Да ли је коначно дошло њено време?

У ствари, концепт гласовног корисничког интерфејса (ВУИ) постоји већ деценијама. Свако ко је гледао Звездане стазе или 2001: Одисеју у свемиру пре много година вероватно је очекивао да ћемо око 2000. године сви контролисати компјутере својим гласовима. Такође, нису само писци научне фантастике видели потенцијал ове врсте интерфејса. 1986. Ниелсенови истраживачи су питали ИТ стручњаке шта мисле да ће бити највећа промена у корисничким интерфејсима до 2000. године. Најчешће су указивали на развој гласовних интерфејса.

Има разлога да се надамо таквом решењу. Вербална комуникација је, на крају крајева, најприроднији начин да људи свесно размењују мисли, па се њено коришћење за интеракцију човека и машине чини као најбоље решење до сада.

Један од првих ВУИ, тзв кутија за ципеле, настао је раних 60-их од стране ИБМ-а. Био је то претеча данашњих система за препознавање гласа. Међутим, развој ВУИ уређаја био је ограничен ограничењима рачунарске снаге. Рашчлањивање и тумачење људског говора у реалном времену захтева много труда, а требало је више од педесет година да се дође до тачке у којој је то заправо постало могуће.

Уређаји са гласовним интерфејсом почели су да се појављују у масовној производњи средином 90-их, али нису стекли популарност. Први телефон са гласовном контролом (бирањем) био је Пхилипс Спаркобјављен 1996. Међутим, овај иновативни уређај који је једноставан за коришћење није био ослобођен технолошких ограничења.

Други телефони опремљени облицима гласовног интерфејса (које су креирале компаније као што су РИМ, Самсунг или Моторола) редовно долазе на тржиште, омогућавајући корисницима да бирају гласом или шаљу текстуалне поруке. Све су оне, међутим, захтевале меморисање одређених команди и њихово изговарање у форсираном, вештачком облику, прилагођеном могућностима тадашњих уређаја. Ово је створило велики број грешака, што је, заузврат, довело до незадовољства корисника.

Међутим, сада улазимо у нову еру рачунарства, у којој напредак у машинском учењу и развоју вештачке интелигенције откључава потенцијал разговора као новог начина интеракције са технологијом (8). Број уређаја који подржавају гласовну интеракцију постао је важан фактор који је имао велики утицај на развој ВУИ. Данас скоро 1/3 светске популације већ поседује паметне телефоне који се могу користити за ову врсту понашања. Изгледа да је већина корисника коначно спремна да прилагоди своје гласовне интерфејсе.

8. Савремена историја развоја гласовног интерфејса

Међутим, пре него што можемо слободно да разговарамо са рачунаром, као што су то урадили јунаци Одисеје у свемиру, морамо да превазиђемо низ проблема. Машине још увек нису баш добре у руковању лингвистичким нијансама. Осим тога многи људи се и даље осећају непријатно да дају гласовне команде претраживачу.

Статистике показују да се гласовни асистенти првенствено користе код куће или међу блиским пријатељима. Нико од интервјуисаних није признао да користи гласовну претрагу на јавним местима. Међутим, ова блокада ће вероватно нестати са ширењем ове технологије.

технички тешко питање

Проблем са којим се системи (АСР) суочавају је издвајање корисних података из говорног сигнала и њихово повезивање са одређеном речју која има одређено значење за особу. Звуци који се производе су сваки пут другачији.

Променљивост говорног сигнала је његово природно својство, захваљујући којем ми, на пример, препознајемо акценат или интонацију. Сваки елемент система за препознавање говора има специфичан задатак. На основу обрађеног сигнала и његових параметара креира се акустички модел који се повезује са језичким моделом. Систем препознавања може да ради на основу малог или великог броја образаца, што одређује величину речника са којим ради. Они могу бити мали речници у случају система који препознају појединачне речи или команде, као и велике базе података који садржи еквивалент језичког скупа и узимајући у обзир језички модел (граматику).

Проблеми са којима се суочавају пре свега гласовни интерфејси правилно разуме говор, у којима се, на пример, често изостављају читави граматички низови, јављају се језичке и фонетске грешке, грешке, пропусти, говорни недостаци, хомоними, неоправдана понављања итд. Сви ови АЦП системи морају да раде брзо и поуздано. Бар су таква очекивања.

Извор потешкоћа су и акустични сигнали осим препознатог говора који улазе на улаз система за препознавање, тј. све врсте сметње и буке. У најједноставнијем случају, они су вам потребни филтрирају. Овај задатак изгледа рутински и лак – на крају крајева, разни сигнали се филтрирају и сваки инжењер електронике зна шта да ради у таквој ситуацији. Међутим, ово се мора урадити веома пажљиво и пажљиво да би резултат препознавања говора испунио наша очекивања.

Филтрирање које се тренутно користи омогућава да се, заједно са говорним сигналом, уклоне и спољашњи шум који је ухватио микрофон и унутрашња својства самог говорног сигнала, која отежавају његово препознавање. Међутим, много сложенији технички проблем настаје када је сметња анализираном говорном сигналу ... други говорни сигнал, односно, на пример, гласне расправе около. Ово питање је у литератури познато као тзв. То већ захтева употребу сложених метода, тзв. деконволуција (разоткривање) сигнала.

Проблеми са препознавањем говора се ту не завршавају. Вреди схватити да говор носи много различитих врста информација. Људски глас сугерише пол, године, различите карактере власника или стање његовог здравља. Постоји обимно одељење за биомедицинско инжењерство које се бави дијагностиком различитих болести на основу карактеристичних акустичних појава које се налазе у говорном сигналу.

Постоје и апликације у којима је главна сврха акустичке анализе говорног сигнала да идентификује говорника или да потврди да је он оно за кога се представља (глас уместо кључа, лозинке или ПУК кода). Ово може бити важно, посебно за технологије паметних зграда.

Прва компонента система за препознавање говора је микрофон. Међутим, сигнал који је ухватио микрофон обично остаје од мале користи. Студије показују да облик и ток звучног таласа веома варирају у зависности од особе, брзине говора, а делимично и расположења саговорника – док у малој мери одражавају сам садржај изговорених команди.

Дакле, сигнал мора бити правилно обрађен. Савремена акустика, фонетика и рачунарство заједно пружају богат скуп алата који се могу користити за обраду, анализу, препознавање и разумевање говорног сигнала. Динамички спектар сигнала, тзв динамички спектрограми. Прилично их је лако добити, а говор представљен у облику динамичког спектрограма релативно је лако препознати коришћењем техника сличних онима које се користе у препознавању слика.

Једноставни елементи говора (на пример, команде) могу се препознати по једноставној сличности целих спектрограма. На пример, речник мобилног телефона који се активира гласом садржи само неколико десетина до неколико стотина речи и фраза, обично унапред сложених тако да се могу лако и ефикасно идентификовати. Ово је довољно за једноставне контролне задатке, али озбиљно ограничава укупну примену. Системи изграђени према шеми, по правилу, подржавају само одређене звучнике за које су гласови посебно обучени. Дакле, ако постоји неко нови ко жели да користи свој глас да контролише систем, највероватније неће бити прихваћен.

Резултат ове операције се зове спектрограм 2-В, односно дводимензионални спектар. Постоји још једна активност у овом блоку на коју вреди обратити пажњу - сегментација. Уопштено говорећи, говоримо о разбијању непрекидног говорног сигнала на делове који се могу посебно препознати. Тек се из ових појединачних дијагноза врши препознавање целине. Овај поступак је неопходан јер није могуће идентификовати дуг и сложен говор у једном потезу. Већ су читави томови написани о томе које сегменте треба разликовати у говорном сигналу, тако да нећемо сада одлучивати да ли ће издвојени сегменти бити фонеми (звучни еквиваленти), слогови или можда алофони.

Процес аутоматског препознавања увек се односи на неке карактеристике објеката. Стотине скупова различитих параметара је тестирано за говорни сигнал.Гворни сигнал има подељен у препознате оквире и имајући изабране карактеристикепри чему се ови оквири представљају у процесу препознавања, можемо извести (за сваки оквир посебно) класификација, тј. додељивање идентификатора оквиру, који ће га представљати у будућности.

Следећа фаза склапање рамова у засебне речи - најчешће на основу тзв. модел имплицитних Марковљевих модела (ХММ-). Затим долази монтажа речи комплетне реченице.

Сада се можемо на тренутак вратити на Алека систем. Његов пример показује вишестепени процес машинског „разумевања“ човека – тачније: команду коју он даје или постављено питање.

Разумевање речи, разумевање значења и разумевање намере корисника су потпуно различите ствари.

Дакле, следећи корак је рад НЛП модула (), чији је задатак препознавање намера корисника, тј. значење наредбе/питања у контексту у коме је изговорена. Ако је намера идентификована, онда додељивање вештина и способности тзв, тј. специфичну функцију коју подржава паметни асистент. У случају питања о времену, позивају се извори података о времену, који остаје да се обради у говор (ТТС - механизам). Као резултат, корисник чује одговор на постављено питање.

Глас? Графичка уметност? Или можда обоје?

Већина познатих савремених система интеракције заснива се на посреднику тзв графички кориснички интерфејс (графички интерфејс). Нажалост, ГУИ није најочигледнији начин интеракције са дигиталним производом. Ово захтева да корисници прво науче како да користе интерфејс и памте ове информације са сваком следећом интеракцијом. У многим ситуацијама, глас је много практичнији, јер можете комуницирати са ВУИ једноставним разговором са уређајем. Интерфејс који не приморава кориснике да памте и памте одређене команде или методе интеракције изазива мање проблема.

Наравно, проширење ВУИ не значи напуштање традиционалнијих интерфејса – радије, биће доступни хибридни интерфејси који комбинују неколико начина интеракције.

Гласовни интерфејс није погодан за све задатке у мобилном контексту. Са њим ћемо позвати пријатеља који вози аутомобил, па чак и послати му СМС, али провера најновијих трансфера може бити претешка - због количине информација које се преносе систему () и генеришу од стране система (система). Као што Рејчел Хинман сугерише у својој књизи Мобиле Фронтиер, коришћење ВУИ постаје најефикасније када се обављају задаци где је количина улазних и излазних информација мала.

Паметни телефон повезан на Интернет је згодан, али и незгодан (9). Сваки пут када корисник жели нешто да купи или користи нову услугу, мора да преузме другу апликацију и направи нови налог. Овде је створено поље за коришћење и развој гласовних интерфејса. Уместо да приморавају кориснике да инсталирају много различитих апликација или креирају засебне налоге за сваку услугу, стручњаци кажу да ће ВУИ пребацити терет ових гломазних задатака на гласовног асистента који покреће АИ. Биће му згодно да обавља напорне активности. Ми ћемо му само наређивати.

9. Гласовни интерфејс преко паметног телефона

Данас је више од телефона и рачунара повезано на Интернет. Паметни термостати, светла, чајници и многи други ИоТ интегрисани уређаји су такође повезани на мрежу (10). Дакле, свуда око нас постоје бежични уређаји који испуњавају наше животе, али се сви не уклапају природно у графички кориснички интерфејс. Коришћење ВУИ ће вам помоћи да их лако интегришете у наше окружење.

10. Гласовни интерфејс са Интернетом ствари

Креирање гласовног корисничког интерфејса ће ускоро постати кључна дизајнерска вештина. Ово је прави проблем – потреба за имплементацијом гласовних система ће вас подстаћи да се више фокусирате на проактивни дизајн, односно покушај да разумете почетне намере корисника, предвиђајући њихове потребе и очекивања у свакој фази разговора.

Глас је ефикасан начин за унос података—омогућава корисницима да брзо издају команде систему под сопственим условима. С друге стране, екран пружа ефикасан начин за приказивање информација: омогућава системима да истовремено прикажу велику количину информација, смањујући оптерећење меморије корисника. Логично је да њихово комбиновање у један систем звучи охрабрујуће.

Паметни звучници као што су Амазон Ецхо и Гоогле Хоме уопште не нуде визуелни приказ. Значајно побољшавајући тачност препознавања гласа на умереним удаљеностима, омогућавају рад без употребе руку, што заузврат повећава њихову флексибилност и ефикасност – пожељни су чак и за кориснике који већ имају паметне телефоне са гласовном контролом. Међутим, недостатак екрана је велико ограничење.

Само звучни сигнали се могу користити за информисање корисника о могућим командама, а читање излаза наглас постаје заморно осим за најосновније задатке. Подешавање тајмера са гласовном командом током кувања је одлично, али није неопходно да вас питате колико је времена остало. Добијање редовне временске прогнозе постаје тест памћења за корисника, који мора да слуша и упија низ чињеница целе недеље, уместо да их на први поглед покупи са екрана.

Дизајнери су већ хибридно решење, Ецхо Схов (11), који је основном Ецхо паметном звучнику додао екран за приказ. Ово значајно проширује функционалност опреме. Међутим, Ецхо Схов је и даље много мање способан да обавља основне функције које су одавно доступне на паметним телефонима и таблетима. На пример, не може (још) да сурфује вебом, приказује рецензије или приказује садржај Амазон корпе за куповину.

Визуелни екран је инхерентно ефикаснији начин да се људима пружи обиље информација од само звука. Дизајнирање са гласовним приоритетом може у великој мери побољшати гласовну интеракцију, али на дуге стазе, произвољно некоришћење визуелног менија зарад интеракције биће као борба са једном руком везаном иза леђа. Због надолазеће сложености енд-то-енд интелигентних интерфејса за глас и екран, програмери би требало озбиљно да размотре хибридни приступ интерфејсима.

Повећање ефикасности и брзине система за генерисање и препознавање говора омогућило је њихову употребу у апликацијама и областима као што су, на пример:

• војни (гласовне команде у авионима или хеликоптерима, на пример, Ф16 ВИСТА),

• аутоматска транскрипција текста (говор у текст),

• интерактивни информациони системи (Приме Спеецх, гласовни портали),

• мобилни уређаји (телефони, паметни телефони, таблети),

• роботика (Цлевербот - АСР системи у комбинацији са вештачком интелигенцијом),

• аутомобилска (хандс-фрее контрола компоненти аутомобила, као што су Блуе & Ме),

• кућне апликације (системи за паметне куће).

Пазите на безбедност!

Аутомобилска индустрија, кућни апарати, системи за грејање/хлађење и кућна безбедност, као и мноштво кућних апарата почињу да користе гласовне интерфејсе, често засноване на вештачкој интелигенцији. У овој фази се шаљу подаци добијени милионима разговора са машинама рачунарски облаци. Јасно је да су трговци заинтересовани за њих. И не само они.

Недавни извештај Симантец-ових стручњака за безбедност препоручује да корисници гласовних команди не контролишу безбедносне функције као што су браве на вратима, а камоли кућни безбедносни системи. Исто важи и за чување лозинки или поверљивих информација. Безбедност вештачке интелигенције и паметних производа још није довољно проучена.

Када уређаји широм куће слушају сваку реч, ризик од хаковања система и злоупотребе постаје велика брига. Ако нападач добије приступ локалној мрежи или повезаним адресама е-поште, подешавања паметног уређаја могу се променити или ресетовати на фабричка подешавања, што ће довести до губитка вредних информација и брисања историје корисника.

Другим речима, безбедносни професионалци се плаше да АИ и ВУИ вођени гласом још увек нису довољно паметни да нас заштите од потенцијалних претњи и да држимо језик за зубима када странац нешто тражи.