Google Assistant - Neuigkeiten von der VOICE Global
Voice- und Chatbot Technologie
Letztes Update am 19. Juni 2020
Google hat mit dem Google Assistant einen der weitverbreitetsten Voice Assistenten im Angebot. Am diesjährigen VOICE Global hat der Senior Director of Product, Payam Shodjai, neue Funktionalitäten vorgestellt, welche ab sofort oder spätestens in den kommenden Monaten verfügbar sind.
In diesem Blog-Beitrag möchte ich auf einige dieser Möglichkeiten eingehen.
Actions Builder
Bis anhin hatte man bei der Entwicklung einer Google Action jeweils zwei Tools verwendet.
Als erstes die Google Action Console über welche die Metadaten einer Action verwalten werden. Zusätzlich kann darüber der aktuellen Stand bequem im Simulator getestet und eine neue Version der Öffentlichkeit zur Verfügung gestellt werden.
Das zweite Tool ist Dialogflow. Hiermit entwickelt der Spezialist das Sprachmodell der Action. Im Dialogflow werden Intents, Entities und Trainingssätze erfasst und so das Natural Language Understanding (NLU), also das Verständnis des Chatbots, trainiert.
Neu möchte Google die Entwicklung von Actions vereinfachen, indem sie die Möglichkeiten welche Dialogflow bietet und einige zusätzliche Funktionalitäten direkt in der Google Action Console anbieten. Das neue - komplett integrierte - Tool heisst Actions Builder und ist für sämtliche neu erstellten Actions ab sofort verfügbar. Der Actions Builder gibt dem Entwickler ausserdem erweiterte Möglichkeiten den Conversation Flow direkt in der Weboberfläche zu definieren.
In diesem Video von Google wird gezeigt, wie der neue Actions Builder zu bedienen ist.
Action SDK
Google hat erkannt, dass nicht alles über eine Weboberfläche abgebildet werden kann und gerade bei komplexeren Actions die Entwicklung ausserhalb der Plattform sinnvoll ist. Entsprechend wurde gemäss Payam das Action SDK so erweitert, dass alle Möglichkeiten, welche über die Actions Console zur Verfügung stehen auch über das Action SDK abgebildet werden können. Das entsprechende Kommandozeilentool bietet Google ebenfalls an.
Weitere Informationen zum Action SDK findest du hier.
Home Storage
Ein Smart Speaker, wie der Google Nest Hub, steht typischerweise im Wohnzimmer. Somit ist das Gerät für alle Personen im Haushalt zugänglich. Der Google Assistant kann dank Voice Match die einzelnen Personen voneinander unterscheiden. Dies erlaubt den Entwicklern für jeden Benutzer spezifische Daten zu speichern.
Neu gibt es die Möglichkeit, dass man in einem Haushalt benutzerübergreifend Informationen ablegen kann, ohne dass sich die Benutzer vorher über eine spezifische Logik miteinander verbinden. Somit können Daten zwischen den Benutzern geteilt werden, was, je nach Action die entwickelt wird, einen Mehrwert bietet. Zum Beispiel kann so die gemeinsame Einkaufsliste gepflegt, die WG-Ausgaben berechnet oder zusammen ein rundenbasiertes Spiel gespielt werden.
Weitere Informationen zum Home Storage findest du in der Dokumentation.
Continuous Match Mode
Bis jetzt hat man als Benutzer mit einer Action in einer Art “Ping Pong” interagiert. Das heisst, ich habe als Benutzer eine Aussage gemacht, welche dann von der Action beantwortet wurde. Der Google Assistant hat automatisch das Mikrofon solange abgeschaltet, bis die Antwort ausgesprochen war und wieder aktiviert, falls auf eine weitere Aussage des Benutzers gewartet werden soll.
Mit dem Continuous Match Mode wird es möglich, dass das Mikrophone nach einer Aussage des Benutzers weiter offen bleibt. Dies führt zu einer natürlichen und flüssigen Kommunikation und ermöglicht neue Anwendungsfälle.
Ein gutes Beispiel zeigt Payam in der Präsentation mit dem Spiel “Montagsmaler”. Als Benutzer wird es hier nun möglich laufend neue Begriffe zu nennen ohne einen ganzen Message-Turn der Action abwarten zu müssen. Diese Funktionalität wird erst im Laufe des Jahres verfügbar sein.
Fazit
Gerade für die Erstellung von einfachen Actions kann die Verwendung des Action Builders die Entwicklungszeit verkürzen. Jedoch muss hier von Fall zu Fall gut abgeschätzt werden, welche Komplexität über so eine Weboberfläche gewartet werden kann und ab welcher Action-Grösse sich eine Lösung unter Verwendung der Action SDK besser eignet.
Über alles hinaus kann man sagen, dass Google die Assistant Plattform immer weiter verbessert und so nicht nur für Voicebot Spezialisten wie Paixon die Grundlage schafft, hochwertige Actions zu entwickeln sondern auch das Erlebniss des Endbenutzers stetig verbessert.
Welche Funktionalitäten würdest du dir im Bezug auf Smart Speakers wünschen? Ich würde mich über einen Austausch freuen.