Sprachassistent: Sirius antwortet Linux-Nutzern

Das Clarity-Lab an der Universität von Michigan hat einen Sprachassistenten für Linux entwickelt und ihn unter dem Namen Sirius als Open Source veröffentlicht. Genau wie Apples Siri, Microsofts Cortana oder Google Now kann er in natürlicher Sprache gestellte Fragen verstehen und beantworten und beherrscht dabei ein Frage-Antwort-System.

Zudem wurde eine Bilderkennung in die Software integriert. So soll es z.B. möglich sein, dem Programm ein Bild des Kölner Doms zu zeigen und nach dem Baujahr zu fragen. Sirius analysiert die Abbildung, erkennt das Bauwerk und sucht aus seiner Datenbank das gewünschte Datum heraus.

Sirius greift auf Ephyra zurück, ein System, das auf gesprochene Fragen mit Informationen aus dem Web antwortet, sowie auf eine im Indri-Format gespeicherte Wikipedia-Datenbank. Die Spracherkennung basiert auf dem Open-Source-Toolkit CMU Sphinx der Carnegie Mellon University und dem Deep Learning Framework Caffe des Berkeley Vision and Learning Centers. Die Bilderkennung schließlich erfolgt mit OpenCV Surf.

Finanziert wird Sirius durch die Defense Advanced Research Projects Agency (DARPA), eine Behörde des Verteidigungsministeriums der USA, die Forschungsprojekte für die Streitkräfte durchführt, sowie die National Science Foundation (NSF), ebenfalls eine Regierungseinrichtung, die Forschung und Bildung finanziell unterstützt. Aber auch Google gibt Geld für das Projekt.

Sirius wurde bislang nur unter Ubuntu getestet. Der Quellcode steht auf GitHub bereit und läuft unter einer BSD-Lizenz. Das Programm muss für die Installation vom Anwender kompiliert werden. Eine Anleitung dazu steht auf der Projektwebsite. Was Sirius leisten kann, erklärt Jason Mars im (englischsprachigen) YouTube-Video. (Quelle: Clarity-Lab/rf)