Alexa, Siri en Google begrijpen geen woord dat u zegt

Amazone

Stemassistenten zoals Alexa, Google Assistant en Siri hebben de afgelopen jaren een lange weg afgelegd. Maar voor al hun verbeteringen houdt één ding ze tegen: ze begrijpen je niet. Ze vertrouwen te veel op specifieke spraakopdrachten.

Spraakherkenning is slechts een goocheltruc

Amazone

Stemassistenten begrijpen u niet. Niet echt, hoe dan ook. Wanneer u spreekt met een Google Home of Amazon Echo, converteert het in essentie uw woorden naar een tekstreeks en vergelijkt dat dan met verwachte opdrachten. Als het een exacte overeenkomst vindt, volgt het een reeks instructies. Als dit niet het geval is, zoekt het naar een alternatief voor wat te doen op basis van de informatie die het heeft en als dat niet werkt, krijg je een foutmelding zoals "Het spijt me, maar ik weet dat niet . "Het is weinig meer dan vaag handmagie om je te laten denken dat het begrijpt.

Het kan geen contextuele aanwijzingen gebruiken om de beste schatting te maken, of zelfs een begrip van vergelijkbare onderwerpen te gebruiken om zijn beslissingen te informeren. Het is ook niet moeilijk stemassistenten te bekritiseren. Terwijl je Alexa kunt vragen "Werk je voor de NSA?" En krijg je een antwoord, als je vraagt "Ben je stiekem een deel van de NSA?" Krijg je een "Ik weet dat niet" antwoord (tenminste bij de tijd van dit schrijven).

Mensen, die echt spraak verstaan, werken niet zo. Stel dat je een mens vraagt: "Wat is die klarvaan in de lucht? Degene die is gebogen en vol gestreepte kleuren zoals rood, oranje, geel en blauw. 'Ondanks dat klarvain een verzonnen woord is, kan de persoon die je vroeg waarschijnlijk uit de context komen dat je een regenboog beschrijft.

Hoewel je zou kunnen beweren dat een mens spraak omzet in ideeën, kan een mens dan kennis en begrip toepassen om een antwoord te concluderen. Als je een mens vraagt of ze in het geheim voor de NSA werken, geven ze je een ja of nee antwoord, zelfs als dat antwoord een leugen is. Een mens zou niet zeggen "Ik weet dat niet" voor een dergelijke vraag. Dat mensen kunnen liegen is iets dat met echt begrip komt.

Spraakassistenten kunnen niet verder dan hun programmering

Spraakassistenten zijn uiteindelijk beperkt tot geprogrammeerde verwachte parameters, en als u erbuiten stapt, wordt het proces verbroken. Dat feit laat zien wanneer apparaten van derden binnenkomen om te spelen. Meestal is het commando om daarmee te communiceren zeer onpraktisch, wat neerkomt op "vertel apparaatfabrikant om optioneel argument te bevelen." Een exact voorbeeld zou zijn: "Zeg Whirlpool om de droger te pauzeren." Voor een nog moeilijker te onthouden voorbeeld, de Geneva Alexa skill controleert sommige GE-ovens. Een gebruiker van de vaardigheid moet onthouden om "Genève te vertellen", niet "vertel GE" dan de rest van het bevel. En terwijl je het kunt vragen om de oven voor te verwarmen tot 350 graden, kun je geen verzoek indienen om de temperatuur met nog eens 50 graden te verhogen. Een mens zou deze verzoeken echter kunnen volgen.

Amazon en Google hebben heel hard gewerkt om deze obstakels te overwinnen, en dat blijkt. Waar je ooit de bovenstaande reeks moest volgen om een slim slot te bedienen, kun je nu zeggen "sluit de voordeur". Alexa was in de war door 'vertel me een hondengrapje', maar vraag er vandaag om, en het zal werken. Ze hebben variaties toegevoegd aan de opdrachten die je gebruikt, maar uiteindelijk moet je toch het juiste commando weten om te zeggen. U moet de juiste syntaxis gebruiken, in de juiste volgorde.

En als je denkt dat dat veel lijkt op een commandolijn, dan ben je niet verkeerd.

Spraakassistenten zijn een Fancy Command Line

Een opdrachtregel is nauw gedefinieerd om eenvoudige taken uit te voeren, maar alleen als u de juiste syntaxis kent. Als u de juiste syntax verwijdert en Dyr in plaats van dir invoert, geeft de opdrachtprompt een foutbericht. U kunt aliassen gebruiken om opdrachten gemakkelijker te onthouden, maar u moet een idee hebben van wat de oorspronkelijke opdrachten waren, hoe ze werken en hoe aliassen efficiënt kunnen worden gebruikt. Als je niet de tijd neemt om de ins en out van de commandoregel te leren, zul je er nooit veel van krijgen.

Voice assistants zijn niet anders. U moet de juiste manier kennen om een opdracht te zeggen of een vraag te stellen. En u moet weten hoe u groepen kunt instellen voor Google en Alexa, waarom het groeperen van uw apparaten essentieel is en hoe u uw slimme apparaten een naam moet geven. Als je deze noodzakelijke stappen niet uitvoert, voel je de frustratie van het vragen aan je stemassistent om het onderzoek uit te zetten, alleen om te worden gevraagd, "welk onderzoek" moet worden uitgeschakeld.

Zelfs als u de juiste syntaxis in de juiste volgorde gebruikt, kan het proces mislukken. Ofwel met de verkeerde reactie uitgegeven of een verrassend resultaat. Twee Google Homes in hetzelfde huis kunnen voor iets verschillende locaties weer geven, hoewel ze toegang hebben tot dezelfde gebruikersaccountinformatie en internetverbinding.

In het bovenstaande voorbeeld wordt het commando "Een timer instellen voor een half uur" gegeven. De Google Home-hub heeft een timer gemaakt met de naam 'Hour' en vervolgens gevraagd hoe lang de timer moet zijn. En toch werkte het drie keer herhalen van hetzelfde commando correct en creëerde een timer van 30 minuten. Het gebruik van de opdracht "Een timer instellen gedurende 30 minuten" werkt correct op een meer consistente basis.

Hoewel het spreken met een Google Home of Echo mogelijk vloeiender is, werken stemassistenten en opdrachtregels onder de motorkap op dezelfde manier. U hoeft misschien geen nieuwe taal te leren, maar u moet een nieuw dialect leren.

Het beperkte begrip van stemassistenten zal de groei beperken

Niets hiervan verhindert dat stemassistenten zoals Google Assistant en Alexa goed genoeg werken (hoewel Cortana een ander verhaal is). Google-assistent en Alexa en zoek naar fatsoenlijke vragen, hoewel niet verrassend. Google is beter in zoeken en kan basisvragen beantwoorden zoals meetconversies en eenvoudige wiskunde. Met een correct opgezette slimme woning en goed opgeleide gebruiker, zullen de meeste slimme huisopdrachten werken zoals bedoeld. Maar dit kwam door werk en inspanning, geen intellectueel begrip.

Timers en alarmen waren simplistisch. Na verloop van tijd werd naamgeving toegevoegd, daarna de mogelijkheid om tijd aan een timer toe te voegen. Ze zijn van simplistisch naar meer gecompliceerd gegaan. Stemassistenten kunnen meer vragen beantwoorden en elke dag brengt nieuwe vaardigheden en functies met zich mee. Maar dat is geen product van zelfgroei dat voortkomt uit leren en begrijpen.

En niets daarvan levert het inherente vermogen om te gebruiken wat bekend is om het onbekende te bereiken. Voor elke opdracht en vraag die wel werkt, zullen er altijd drie zijn die dat niet doen. Zonder een doorbraak in A.I. die een mensachtig vermogen om te begrijpen verleent, zijn stemassistenten helemaal geen assistenten. Het zijn slechts spraakopdrachtregels, handig in het juiste scenario maar beperkt tot de scenario's waarvoor ze zijn geprogrammeerd om te begrijpen.

Met andere woorden: machines leren dingen, maar begrijpen ze niet.