Amazon hat es einfacher gemacht, benutzerdefinierten Alexa Skills Sounds hinzuzufügen

Ich bin als Amazon Alexa Champion anerkannt und habe mehr als zwanzig benutzerdefinierte Fähigkeiten auf der Plattform veröffentlicht. Ich suche weiterhin nach neuen Möglichkeiten, um diese Technologie zu erweitern, und eine der besten Möglichkeiten, die Benutzererfahrung zu verbessern, ist das Hinzufügen von Sounds. Angesichts der jüngsten Verbesserung der Amazon Alexa-Plattform ist dies noch einfacher geworden. Hier finden Sie eine kurze Übersicht darüber, wie Sie diese neue Funktion nutzen können.

Wie Amazon Alexa funktioniert

Die Alexa-Plattform bietet die Möglichkeit, benutzerdefinierte Fähigkeiten von Drittentwicklern zu aktivieren. Mittlerweile sind mehr als 30.000 verfügbar, und die Millionen von Alexa-Benutzern können sie auf ihren Geräten aktivieren. Diese reichen von der Bestellung einer Pizza von einer beliebten Kette bis zum Spielen von Geräuschen, um das Schlafen zu erleichtern.

Die Architektur für diese benutzerdefinierten Fähigkeiten besteht aus zwei Komponenten. Die erste ist die Sprachkomponente, die die Modelle für maschinelles Lernen der Alexa-Plattform nutzt. Dies ist es, was die Anfragen nach gesprochenem Wort in eine Reihe von Anweisungen übersetzt.

Die andere Komponente ist die if / then / else-Logik, die entscheidet, welche Antwort an den Benutzer zurückgegeben werden soll. Dies wird auf einer AWS Lambda-Funktion gehostet.

Zur Verbesserung der Fähigkeiten können zusätzliche AWS-Services sowie Tools von Drittanbietern verwendet werden. Dies umfasst die Aufnahme von benutzerdefinierten MP3-Sounds und -Grafiken, die von der Lambda-Funktion genutzt werden können.

Um Sounds hinzuzufügen, werden MP3-Dateien in einen S3-Bucket hochgeladen und die entsprechende Zugriffsrichtlinie angewendet, damit sie von einem Alexa-Gerät gelesen werden kann.

Herausforderungen beim Hinzufügen benutzerdefinierter Sounds

Eine der Eintrittsbarrieren für die Aufnahme von Sounds in benutzerdefinierte Fähigkeiten war die Fähigkeit, qualitativ hochwertige Sounds aufzunehmen. Diese Sounds müssen den genauen Standards für die Plattform entsprechen, einschließlich Bitrate und Sampleraten. Dies kann durch Erfahrung in der Tonbearbeitung mit Software wie Audacity erreicht werden, erhöht jedoch die Zeit für die Entwicklung der Fähigkeiten.

Das Aufnehmen hochwertiger Sounds kann ebenfalls eine Herausforderung sein. Es gibt Apps für mobile Geräte, die die Aufnahme ermöglichen, aber der Zugriff auf eine Vielzahl von Sounds ist schwierig. Zum Beispiel das Dröhnen eines Flugzeugs oder das Geräusch eines Elefanten.

Alternativ kann ein Alexa-Entwickler nach Sounds suchen, die von anderen aufgenommen wurden. Es gibt einige Repositories im Internet, die diese haben, aber die meisten kosten Geld für die Lizenzierung und erfordern ein Resampling mit Software wie Audacity, um die richtigen Soundattribute zu erhalten.

Kostenlose MP3-Inhalte

Amazon hat jetzt einen Katalog mit Hunderten von Sounds veröffentlicht, die bereits unter den genauen Standards aufgenommen wurden, die von der Plattform gefordert werden. Genau wie im obigen Architekturdiagramm werden sie in einem S3-Bucket unter AWS veröffentlicht und können von jeder benutzerdefinierten Fähigkeit verwendet werden.

Die vollständige Liste finden Sie auf der Entwicklerseite. Hier sind die Hauptkategorien.

Die Reichweite ist groß. Motorradmotoren, Feuerwerksgeräusche und das Dröhnen eines Bären sind immer zur Hand. Für die Verwendung dieser sind keine Lizenzgebühren erforderlich, und die Kosten für das Herunterladen der Soundclips werden Ihrem AWS-Konto nicht belastet.

Wie man Sound in einer Grundfertigkeit benutzt

Wenn Sie gerade erst mit Amazon Alexa beginnen, beginnen Sie mit den grundlegenden Vorlagen auf der Alexa GitHub-Seite. Dies beinhaltet den Aufbau einer Trivia-Fähigkeit, einer Fakten-Fähigkeit oder einfacher Ratespiele. Zum Beispiel habe ich kürzlich eine lustige Kinderfertigkeit namens Easter Egg Hunt veröffentlicht. Hier ist das komplette Repo auf GitHub, einschließlich der Lambda-Funktion sowie des Intent-Modells.

Bei jeder der Nachrichtenantworten können Sie die SSML-Syntax hinzufügen, um den Link zur MP3-Datei in den S3-Bucket aufzunehmen. Hier ist ein Beispiel aus dem Welcome Handler für die Fertigkeit Osterei.

// This is the initial welcome message var welcomeMessage = "Welcome to the Easter Bunny Egg Hiding Game. I will ask you multiple questions that you should answer yes or no. Based on your choices, I will make a recommendation on where to hide an egg. Are you ready to begin?"; this.emit(':ask', welcomeMessage, repeatWelcomeMessage);

Wenn der Benutzer diese benutzerdefinierte Fähigkeit zum ersten Mal aufruft, spielt das Alexa-Gerät den Soundclip für das Trompetenhorn ab und liest dann die Syntax mit der Standardstimme.

Bereit anzufangen?

Melden Sie sich bei Amazon für ein kostenloses Entwicklerkonto an und bauen Sie noch heute Ihre ersten Fähigkeiten auf! Der Amazon-Entwicklerblog verfügt über einige großartige Ressourcen, die Sie zu diesem Thema nutzen können, einschließlich dieses kürzlich veröffentlichten Beitrags mit Ideen zur Verwendung dieser neuen Inhalte.