Das neue Interface „Voice“ erfordert in vielerlei Hinsicht ein Umdenken – nicht nur in der Content-Erstellung, sondern auch in der Konzeption von User Experiences und dem Design von Schnittstellen. Unser Gastautor Tim Kahle, Gründer der Voice-Agentur 169 Labs, gibt Einblicke aus dem Maschinenraum, wie er und sein Team die beliebte App Quizduell für Amazon Alexa fit gemacht haben.
Von Tim Kahle
Alexa-Entwickler der Stunde – und nicht nur wir – leisten Pionierarbeit. Wir erinnern uns an die Anfänge der Smartphone-App-Entwicklung vor rund 10 Jahren und stellen auch heute fest: Viele Dinge werden zum allerersten Mal umgesetzt. Dabei helfen keine Stackoverflow-Tickets, keine Best Practices, keine Apps, die Inspiration bieten. Kopf in den Sand stecken oder durchziehen? Wir haben uns für die zweite Variante entschieden!
Mit Quizduell hat unsere Voice Assistant Agentur 169 Labs in Deutschland das erste Multiplayer-Spiel für Amazon Alexa entwickelt. Nutzer können nahtlos zwischen der mobilen App und dem Alexa Skill wechseln. Oft schon haben Entwickler für Alexa schon davon geträumt, dass Nutzer eine Interaktion auf einem Smartphone per Fingertipp beginnen und per Sprache weiterführen – der Begriff der Multimodalität ist das entsprechende Synonym.
Inhalte müssen Voice-kompatibel gemacht werden
Mit dem berühmten „Casual Game“ Quizduell haben wir uns an diesen Traum herangewagt und ermöglichen es den 34 Millionen registrierten Nutzern in Deutschland, ihre Freunde auch per Sprache herauszufordern. In anderen Projekten hatten wir bereits gelernt, dass Inhalte sprach-kompatibel werden müssen und nicht einfach 1:1 aus dem Web oder einer Mobile App übernommen werden können. Auch in unseren Workshops wie etwa dem mobilbranche.de-Seminar „UX-Konzeption für Alexa Skills & Co“ am 30. Januar 2019 in Berlin, in denen wir die Grundlagen der UX-Konzeption für Anwendungen für Sprachassistenten vermitteln, steht dieser Tipp an erster Stelle. Wir müssen einfach verstehen, dass Voice nicht nur ein weiterer Kanal ist, sondern ein völlig neues Ökosystem. Es erfordert neue Workflows, um Inhalte und Konzepte dialogfähig zu machen.
Bei der Umsetzung des Quizduell Skills sind wir an die natürlichen Grenzen der Übertragbarkeit von Screen-/Touch-UX auf Voice gestoßen. Das Motto lautete: Das Sichtbare wird unsichtbar, darf aber nicht unbemerkt bleiben.
Bei der Entwicklung von Quizduell haben wir das gelernte Spielkonzept intensiv studiert und festgelegt, was davon per Sprache sinnvoll umsetzbar ist und an welchen Stellen wir Anpassungen vornehmen müssen. Dem Prinzip des Spiels mussten wir natürlich trotzdem treu bleiben, damit Nutzer es gleichermaßen über die Mobile App und den Alexa Skill spielen können.
Unsere 5 größten Learnings aus der Umsetzung des Quizduell Skills:
1. Transparenz über Auswahlmöglichkeiten
Zwar gibt es mittlerweile Echo Geräte mit Display, wie den Amazon Echo Show oder Echo Spot, dennoch sind rund 90% der Geräte im Markt ohne Bildschirm.
Die goldene Regel heißt: Voice first. Das stellt Entwickler von Voice Apps vor eine große Herausforderung: Ohne den Nutzer zu blamieren oder zu übergehen müssen wir ihm möglichst viele Entscheidungen und Auswahlmöglichkeiten, im wahrsten Sinne des Wortes, „mundgerecht“ servieren. Das führte dazu, dass bei Quizduell auf Alexa der Funktionsumfang auf die Grundfunktionen beschränkt werden musste, da es ohne visuelle Anker aus Nutzersicht fast unmöglich ist, den Überblick zu behalten. Die User können aktuell nach erfolgreicher Verknüpfung ihres Accounts gegen beliebige Spieler und Freunde neue Spiele starten oder laufende Spiele fortführen. Das klingt zunächst recht simpel – reichte aber schon aus, um mehrere tausend Zeilen Code zu schreiben. Bei Start des Skills passieren im Hintergrund rund 10 Fallunterscheidungen, die sich darauf auswirken, was Alexa dem Nutzer dann neben einem „Hallo zurück!“ sagt. Entscheidend ist: Habe ich ein oder mehrere laufende Spiele? Bin ich dran oder nicht und wenn ja, bei wievielen Spielen und gegen wen? Habe ich eine oder mehrere offene Herausforderungen? Wer fordert mich heraus? Möchte ich ein neues Spiel gegen einen beliebigen Spieler oder Freund starten? Wenn es ein Freund sein soll, wer aus meiner Liste? Gegen wen davon kann ich überhaupt ein neues Spiel starten?
Diese gesamten Informationen (und noch mehr) haben Einfluss darauf, was Alexa dem Nutzer in der Willkommensnachricht sagt – und was nicht. Auf einem Smartphone-Screen zeigen wir alle Informationen einfach neben- und untereinander an – der Nutzer wird sich schon heraussuchen, was er braucht oder nutzen möchte.
2. Übergänge
Das dynamische Nachladen oder Zwischenspeichern von Daten muss im Voice Kontext in Millisekunden abgehandelt werden. Der Nutzer gibt eine richtige oder falsche Antwort, der Skill kommuniziert daraufhin mit einer API und muss sofort die nächste Interaktion anpreisen. Im mobilen Kontext hingegen können wir einen „Schließen“ oder „Zurück“-Button einfügen und die darauf folgende Ansicht erst einblenden, wenn alle Daten vollständig geladen sind (z.B. mit Lazy Loading). Auf Voice ist jede Schließen-, Beenden- oder Fortfahren-Interaktion eine weitere Frage, die den Nutzer im Zweifel mehrere Sekunden kostet und damit eine natürliche Frustrationsgrenze schneller erreichen lässt.
3. Eingabe bzw. Ausgabe von Spielernamen und Antwortmöglichkeiten
Bei Quizduell gibt es keine Konvention zur Benennung seines Spielernamens. Sonderzeichen, Emojis, Zahlen – alles ist erlaubt. Die Fragen beinhalten gelegentlich Fachbegriffe oder Wörter aus einer anderen Sprache. Alexas Aussprache dieser Wörter ist zum Teil noch nicht natürlich, die Eingabe dieser Begriffe ist aus Nutzersicht aktuell kaum möglich. Aus diesem Grund wurde die Spracheingabe von Nutzernamen nicht ermöglicht und während des Quiz können die Nutzer während des Duells nur mit A B C oder D antworten und nicht das Wort aus den Antwortmöglichkeiten zurückgeben. In einer Folgeversion des Skills könnte sich das ändern, die Qualitätssicherung von ca. 27.000 Fragen ist allerdings entsprechend aufwändig.
4. Temporär inaktive Funktionen oder Auswahlmöglichkeiten
UX-Konzepte für Screens bedienen sich .active, .hover, .visited, .disabled oder anderer Klassen, um Nutzern zu verdeutlichen, ob und was sie nun mit dieser Auswahlmöglichkeit tun oder nicht tun können. Auf Voice müssen wir diese hilfreichen Features alle unsichtbar umsetzen, ohne den Nutzer zu frustrieren. Ein Negativ-Beispiel wäre: Bei jedem Schritt bis ins Detail erläutern, welche Auswahlmöglichkeiten der User gerade hat und welche (temporär) nicht. Die Freundesliste im Skill, über die man neue Herausforderungen für eine Quizrunde versenden kann, ist ein gutes Beispiel dafür. Auf einem Screen graue ich einfach alle Nutzer aus, die ich nicht herausfordern kann. Lasse ich diese Namen im Voice Kontext einfach weg? Was ist, wenn ich aktuell keinen meiner Freunde herausfordern kann, weil ich gegen alle schon ein laufendes Spiel habe? Was ist, wenn ich mich eigentlich gar nicht an die kryptischen Nutzernamen meiner Freunde erinnere? Die größte „Herausforderung“ hatten vor allem wir bei der Umsetzung des Alexa Skills, diese und andere Dinge nutzerfreundlich zu gestalten.
5. Spielen ohne Nutzeraccount
Quizduell sah bis heute keine Option für Nutzer vor, die keinen Konto haben. Per Screen ist dieses Konto binnen Sekunden erstellt. Unser Anspruch lag darin, es potenziell jedem Alexa Nutzer zu ermöglichen, Quizduell zu nutzen. Dabei ist ein gänzlich neues Spielkonzept entstanden: Im „Trainingsmodus“ können Spieler täglich 10 neue Fragen beantworten und erfahren am Ende, wie gut sie sich gegen den Rest der Spieler geschlagen haben. Eine wichtige Erweiterung, um gänzlich ohne Medienbruch (Eingabe des Nutzernamen und Passworts über die Alexa Companion App) Nutzern eine Quizrunde zu ermöglichen.
Voice als neues Ökosystem
Halten wir fest: Voice ist ein neues Ökosystem und erfordert ein Umdenken und eine Menge Kreativität.
Wir lernen mit dem Feedback der Nutzer dazu und verbessern die UX von Tag zu Tag. Der Launch des Alexa Skills von Quizduell in England und in den USA steht kurz bevor, insgesamt ist Quizduell in 16 Sprachen verfügbar.
Die Entwicklung von Quizduell für Amazon Alexa war Pionierarbeit: Die Nutzer können neben dem Smartphone nun auch in der Küche, auf der Couch, im Bad oder im Auto hands-free bei dem beliebten Quiz-Spiel gegen andere Spieler antreten. Alles, was sie dazu sagen müssen, ist: „Alexa, starte ein Quizduell!“
Über den Autor:
Tim Kahle ist Co-Gründer von 169 Labs mit Sitz in München und Köln, einer der führenden Voice-Assistant-Agenturen Deutschlands und empfohlener Umsetzungspartner von Amazon für Alexa Skills. Von Amazon wurde er vor kurzem als „Alexa Champion“ ausgezeichnet. In seinem Podcast interviewt er regelmäßig Experten zu digitalen Sprachassistenten. Kahle ist Diplom-Medienökonom und bringt Erfahrungen aus mehr als 10 Jahren im UX-/UI-Design und Online Marketing mit. Bei 169 Labs ist er verantwortlich für die Konzeption, das Design und die Vermarktung von Sprachanwendungen.
Seminartipp
UX-Konzeption für Alexa Skills & Co: Workshop zu Voice Assistants am 30. Januar 2019
Mehr als 50.000 Alexa Skills von externen Entwicklern gibt es bereits – und täglich werden es mehr. Zugleich erobern Smart Speaker wie der Amazon Echo, Google Home oder Apples Homepod die deutschen Wohnzimmer und Küchen im Sturm. Sprachbasierten Interfaces gehört also die Zukunft – und es ist Zeit, dass Sie Ihr Unternehmen fit für das Voice-Zeitalter machen. Und genau das haben wir vor in unserem Workshop „UX-Konzeption für Alexa Skills & Co“: Einen Tag lang wird Ihnen Tim Kahle zeigen, wie Sie erfolgreiche Anwendungen für Voice Assistants konzipieren.
Infos & Anmeldung zum Seminar „UX-Konzeption für Alexa Skills & Co.“ hier!