Juraj Recký Juraj Гръцки

Гласовият контрол на интелигентните устройства има неоспорим брой предимства. Вече сте изпробвали своя гласов асистент на вашия смартфон или слушалки?

Може да изглежда, че гласовите асистенти са област на смартфоните, откакто Apple представи Siri през 2011 г., но историята на гласовия контрол е доста богата. Първата технология с гласово управление датира от 1911 г. Това е играчка, наречена Radio Rex. Куче излезе от зелената хижа, след като изрекохте думата Рекс.

Друга важна стъпка в развитието на гласовите асистенти беше IBM Shoebox, която разпознаваше 16 думи и числа от 0 до 9. Това беше компютър, който по това време можеше да се нарече личен. Представен е през 1962 г. на световното изложение в Сиатъл. IBM представи първия персонален компютър, какъвто го познаваме днес, около 20 години по-късно.

гласовите
РЕСУРС към datadacience.com

През 70-те години университетът Карнеги Мелън в Питсбърг, с щедрата подкрепа на Министерството на отбраната на Съединените щати, разработи Harpy, който имаше речник от около хиляда думи, нивото на дете на около три години. Същият научен екип скоро представи решение, което успя да разпознае не само отделни думи, но и прости изречения, съответно. групи думи.

Входът към съвременната история на цифровите гласови асистенти започва да се изсипва през 90-те години, когато технологията, която е в състояние да отговори на човешкия глас, започва да се използва в компютри от IBM или Microsoft.

Въображаемият портал към съвременната история на гласовите асистенти беше най-накрая отворен през 1994 г., когато на много ранен етап от това, което познаваме днес, IBM предложи цифров гласов асистент в своя мобилен телефон Simon. Основният поток обаче не влезе.

РЕСУРС time.com

Гласовият контрол беше популяризиран само от Apple, когато Siri представи iPhone 4S през октомври 2011 г. Както е обичайно за компания с логото на ухапана ябълка, това не е нещо, което те са разработили след пиките. Apple придоби Siri Inc през 2010 г., първоначално под името SRI International и субсидирана от DARPA и Министерството на отбраната на САЩ.

iPhone 4S - първият с интегриран Siri SOURCE Apple

Ако някога сте се забавлявали с гласовия асистент на вашето интелигентно устройство, вероятно сте забелязали, че отговорите му са бързи като добра интернет връзка. Въпреки че има смели видения, че гласовият асистент ще работи само при записване, все още трябва да сте онлайн днес. Вашите поръчки се изпращат до отдалечен облак, където поръчката се сравнява, оценява и решението се изпраща обратно на вашето устройство.

РЕСУРС itsecurityguru

Целият процес се основава на машинно обучение, така че колкото повече използвате асистента, толкова по-интелигентно, по-точно и по-бързо. Изкуственият интелект трябва да е толкова напреднал, че ако помолите асистент да избере жанр на държава от вашата музикална библиотека, но вместо това го пуснете, просто кажете „стоп“ и асистентът ще разбере, че е направил грешка.

Недостатъкът е, че дори ако искате да използвате асистента за операции, които изрично се извършват на вашето устройство, като например набиране на телефонен номер, пак трябва да сте онлайн.

Ако досега сте избягвали гласови асистенти само защото не разбират словашки, опитайте ги. Всичко, от което се нуждаете, е относително прост речник от английски думи. Дори и с наистина отвратителен акцент, асистентът ще ви разбере доста добре. Компаниите за дешифриране на акценти или жаргон работят интензивно. Наскоро няколко пъти писахме за това, че командите на асистентите на компанията се пренаписват и използват за учебни машини.

Интелигентното устройство с гласов асистент постоянно слуша. Изрязва командата, за да я активира. Когато го събудите, той пита как да помогне. Той разпознава, че сте прекратили командата въз основа на по-дълга или дълга пауза. Ето защо е добре асистентът да говори ясно, отчетливо и съответно разумно бързо. динамично. Внимавайте обаче да не говорите бързо.

В момента най-използваните и най-популярните гласови асистенти включват Siri, Alexa (или Echo), Cortana, Bixby и Google Assistant. Списание Reviews.com разгледа отблизо изобщо и оцени първите три.

РЕСУРС Wccftech

Alexa очевидно доминира в категорията за съвместимост. Той има технология за сравнение на гласа, може да се използва от няколко души на едно устройство, може незабавно да превежда на чужди езици, а най-силното му оръжие е, че можете да го намерите на повече от 7400 устройства на Internet of Things. Напротив, малко е тъжно, че той разбира само три езика.

Google Now спечели теста в категорията с най-добър отговор. Той също така разпознава множество гласове на едно устройство, може да превежда незабавно, може да бъде намерен на около хиляда устройства на Internet of Things и разбира 4 езика. Както Alexa, така и Google Asisten имат опцията да деактивират качването на вашите поръчки в настройките и да ги изпратят на компаниите майки за анализ или за подпомагане на обучението на учителя.

РЕСУРС eMarketer

Най-популярен е Siri. Причина? То се тласка най-вече от компанията майка. Той разбира множество потребители на едно устройство, може да превежда незабавно, има много ограничени настройки, дори по въпроси, свързани с поверителността, и може да бъде намерен на около 50 устройства на Internet of Things. Той обаче превъзхожда броя на езиците, които разбира. Те са само 21 на словашки, а не на чешки.

Alexa е малко специфична в сравнение с други гласови асистенти. Домашната й среда не е смартфон. Разбира се, можете да използвате Alex на телефони с Android, като използвате приложението, но домашната среда на този асистент е предимно приспособления за дома или слушалките.

РЕСУРС Amazon

Значителна полза е, че може да изпълнява множество поръчки подред, без да се налага да ги въвеждате многократно. Така че, за да поискате от календара преглед на текущия ден, да пуснете музика и да потърсите нещо в интернет, можете да въведете Алекс като една команда, не е нужно да я събуждате отново.

Както споменахме по-горе, Алекс може да бъде намерен на приблизително 7400 типа IoT устройства. Следователно е ясно, че има по-близки команди и задачи, които не са толкова типични за интелигентните мобилни устройства. Освен това, тъй като Alexa е от работилница на Amazon, пазаруването с нея е изключително лесно.

Google Now има огромни амбиции. Интернет търсачката висеше някъде в състезанието за гласов асистент и му отне известно време, за да осъзнае, че има огромно количество информация в ръцете си, която може да използва. Но той вече е хванат.

Вероятно най-силното оръжие на този асистент е, че е най-близо до пълноценното му използване офлайн. Смартфоните Pixel ще бъдат оборудвани с технология, която може да компресира данни за асистента до една двадесет и пета без загуба на качество. Грубо казано, това означава, че настоящите 2 GB помощник за данни в облака биха заели само 80 мегабайта на интелигентното устройство.

За сравнение, този асистент се основава на този, който се учи най-бързо и прави най-малко грешки. Това е съвсем логично, като се има предвид огромното количество данни, с които разполага Google. Благодарение на тях Google Assistant може да изпълнява няколко задачи с една команда. За разлика от Алекс обаче доста специфичен.

При представянето на най-новите възможности на Google Assistant, изкуственият интелект успя да избере снимки от конкретно пътуване от фотоалбум, въз основа на метаданни, един от тях специфичен, асистентът трябваше да избере снимка на животно и да я изпрати на конкретен имейл адрес. Подобна последователност от задачи е значително по-сложна за изкуствения интелект, отколкото три различни по ред задачи.

Успехът на Siri наистина ли зависи само от добрия маркетинг? Със сигурност не, но има малко специфична позиция. Apple, като собствена компания, поддържа краткия си гласов асистент. Да добавите приложение на трета страна към Siri? Няма да успееш. Да, можете да използвате Spoti, за да стартирате Spotify например, но там свършва съвместимостта на приложението с асистента.

От друга страна, Apple предлага все повече услуги и свои собствени решения, така че ако този асистент ви подхожда най-много, ще получите почти всичко, от което се нуждаете. Това обаче ще ви струва избор.

Точно поради тези причини вие също няма да се насладите на гласовото управление, например, на интелигентна тоалетна чиния. Така че не толкова скоро. Докато други гласови асистенти също използват стартъпи за своите повече или по-малко луди джаджи, Apple Siri пуска само доказани продукти.

През 2017 г. Samsung реши да се присъедини към света на гласовите асистенти със собствено решение. Той представи Биксби. Докато други асистенти използват микрофона почти изключително за изпълнение на задачите си, Bixby работи и с камера за идентифициране на обекти.

Засега той е в относително ранната фаза на своето съществуване и основно помага на потребителите да се ориентират в устройството или да организират деня. Разбира се, това решение се основава и на машинно обучение, така че Bixby е толкова по-умен, колкото повече го използвате. Както при гореспоменатите асистенти на едно устройство, той разпознава различни гласове и може да реагира на тях по персонализиран начин.

С Bixby той може да се справя с основни задачи, като четене на входящи съобщения, без да вдига телефона, но и да усложнява, да кажем, да добави селфи към Instagram. Този гласов асистент разбира няколко приложения, изброени в менюто на асистента под Какво може да направи Bixby.

РЕСУРС Samsung

Bixby Vision използва камера, за да идентифицира какво вижда и добавя необходимата и интересна информация. Той също така превежда сканиран текст, може да търси в менюто на магазина, идентифицира храната и нейните калории, помага ви да опитате грим или разпознава вино благодарение на приложението Vivino.

Bixby предлага и Bixby Home, където може да създаде среда за отметки, която ви интересува най-много. Той може също така да създава рутини, които са много подобни на IFTTT. По този начин той стартира програмирана последователност от задачи, например, когато пристигнете на определено място.

Потребителите на устройства на Microsoft могат да управляват своите персонални компютри, лаптопи или таблети чрез глас с помощта на Cortana. Може да се инсталира и на устройства с Android. Когато го пуснете за първи път, той ще ви предложи първични новини и прогноза за времето.

Cortana използва търсачката Bing, която може да ви предложи синоними, дефиниции или преводи на думи. Ако не сте сигурни, отворете раздела с браузъра. Ако разрешите на този гласов асистент достъп до вашето местоположение, той също ще планира пътуването ви до работа. Но той също може да намери програма на кина наблизо или автобусна спирка.

РЕСУРС Microsoft

Той може също да търси на вашето устройство файлове и документи, създадени през последните дни. Ако създавате ново събитие в календара, той може сам да поиска необходимата информация. Можете да активирате Cortana в лентата за търсене и ако устройството ви няма микрофон, можете също да комуникирате с асистента, като пишете команди.

Има няколко гласови асистенти. Alibaba Group предложи AliGenie, BlackBerry има BlackBerry Assistant, интересен е Mycroft, който е с отворен код, и много други. При алтернативния подбор обаче трябва да се вземат предвид несъвършенствата, които са резултат от малкия брой на гласовия асистент.