Obwohl sprachgesteuerte Technologien ein rasantes Wachstum verzeichnen, hat sich dies bisher nicht in einem steigenden Interesse an Nachrichtenkonsum auf diesen Geräten niedergeschlagen, laut verschiedenen Berichten. Die für intelligente Lautsprecher und Sprachassistenten entwickelten Inhalte und Potenziale stehen noch immer vor vielen Herausforderungen, was den Nachrichtenkonsum und die -produktion betrifft.
Das erste Kommunikationsmittel des Menschen war die Sprache. Die Schrift kam erst in jüngerer Zeit auf. Was die Geschichte des Internets betrifft, so kam zuerst die Schrift und dann der Ton.
Bereits 1961 entwickelte IBM das erste Spracherkennungsprogramm „Shoebox“, welches gerade einmal 16 Wörter und Ziffern erkennen konnte. Aber das Potenzial dieser Art von Technologie wurde erkannt, und in den folgenden Jahrzehnten beteiligten sich auch andere Unternehmen an den Fortschritten bei der Worterkennung.
Der “große Sprung” gelang jedoch erst mit der Einführung von Siri durch Apple im Jahr 2011. Von da an wurden diese Sprachtools als Sprachassistenten bezeichnet, da sie in der Lage waren, zuzuhören, zu antworten und Aufgaben per Sprachbefehl auszuführen. Seitdem wurden Sprachassistenten populär und für die breite Bevölkerung zugänglich.
Von den etwa acht Milliarden Menschen auf der Welt haben etwa zwei Drittel ein Smartphone. Die meisten von ihnen verwenden ein Android- oder IOS-Gerät und haben somit Zugang zur Nutzung von Sprachassistenten. Erhebungen zufolge verwenden gerade einmal 45 % der Internetnutzer:innen weltweit Sprachbefehle und Sprachsuche, wenn man alle Geräte berücksichtigt. Was bedeutet das für die Nachrichtenmedien?
Sprachassistenten und Nachrichtenmedien
Wir können die Diskussion über Sprachassistenten im Nachrichten-Bereich nicht von der Diskussion über Künstliche Intelligenz (KI) in den Nachrichtenredaktionen trennen – sei es in der Berichterstattung, der Produktion oder der Verbreitung von Nachrichten. KI-Anwendungen erfordern zusätzliche Kompetenzen, Mittel und eine breite ethische Debatte.
Eines der ersten Medienunternehmen, das mit dem Einsatz von Künstlicher Intelligenz durch Sprachassistenten experimentierte, war 2017 der Londoner Evening Standard. Im selben Jahr brachte die BBC in Zusammenarbeit mit Amazon ihren ersten vollständigen „Voice Skill“ für Alexa heraus. Im Jahr darauf startete The Guardian zusammen mit Google das „Guardian Voice Lab“.
Obwohl die Nutzung von sprachgesteuerten Lautsprechern in den letzten Jahren stetig zugenommen hat, bleibt die Nachrichtennutzung enttäuschend gering, wie einige Berichte nahelegen. Der Nutzer:innen-Anteil, der Smart Speaker für Nachrichtenkonsum nutzt, geht sogar zurück, während die Geräte gleichzeitig immer mehr zum Mainstream werden. Laut dem Digital News Report 2019 greifen in den USA (35 %) und im Vereinigten Königreich (39 %) weniger als vier von zehn Personen über ihr Gerät auf Nachrichten zu, in Deutschland (27 %) und Südkorea (25 %) ist es nur ein Viertel. Soviel zur Konsumseite.
Auf der Seite der Nachrichtenproduktion stehen die großen Tech-Plattformen im Zentrum. Da Google und Amazon versuchen, mehr aggregierte Nachrichtendienste per Sprache anzubieten und die technologische Entwicklung in diesem Bereich voranzutreiben, ist es sehr wahrscheinlich, dass Plattformen eine immer wichtigere Rolle spielen werden. Es stellt sich jedoch die Frage, ob die Nachrichtenmedien daran interessiert sind, in neue Dienstleistungen zu investieren, die zwar einen Mehrwert für die Plattformen schaffen, jedoch ohne Optionen zur Selbstvermarktung. Es wird immer häufiger untersucht, wie KI eingesetzt werden kann, um Kommunikationsfachleuten dabei zu unterstützen, bessere Geschichten zu finden und zu erzählen.
Medienunternehmen haben langjährige Erfahrung und wissen genau, wie sie Nachrichten für das Fernsehen, das Radio und für Internet-Websites aufbereiten müssen. Aber welches ist das beste Format und die beste Herangehensweise für sprachgesteuerte Technologien? Wie können Nachrichten so präsentiert werden, damit sie als relevant angesehen werden und als erstes Suchergebnis dieser Sprachassistenten erscheinen?
Die Herausforderungen der sprachgesteuerten Suche
Der Einsatz von KI in Redaktionen, sei es bei der Berichterstattung, der Produktion oder der Verbreitung von Inhalten, erfordert fachliche Kompetenzen, Ressourcen und eine ethische Debatte. Über die Basiskompetenzen im Bereich KI hinaus braucht es eine gezielte Schulung von Journalist:innen und Redakteur:innen in den spezifischen technischen Fertigkeiten, um eine Unternehmenskultur zu fördern, die für den Einsatz dieser Technologie offen und fit ist.
Algorithmen sind für Unternehmen, die Sprachassistenten einsetzen, von grundlegender Bedeutung. Allerdings funktioniert die sprachgesteuerte Suche anders als die Suche in Schriftform. Bei der schriftlichen Suche in einer Suchmaschine erscheint eine Liste mit mehreren Hyperlinks zu Websites. Der Algorithmus legt eine lange Liste von Links fest, aus welcher die suchende Person die Möglichkeit hat, aus allen Optionen zu wählen. Diese Liste erstreckt sich meist über mehrere Ergebnisseiten. Bei intelligenten Lautsprechern würden Sprachassistenten jedoch sehr lange brauchen, um die Ergebnisse in solcher Ausführlichkeit zu präsentieren. Der Algorithmus legt deshalb ein einziges Ergebnis für die suchende Person fest.
Die Verwendung von Sprache bringt auch neue Komplexitätsebenen mit sich: Wir neigen dazu, in unstrukturierter Art zu sprechen. Hinzu kommt, dass ein großes KI-System wie Alexa sehr komplex ist, und dass verschiedene Alexa-Dienste unterschiedliche Namen – oder Slots – für dieselben Daten verwenden. Mit der zunehmenden Verbreitung von sprachgesteuerten Elementen im Leben der Menschen sehen sich auch Medien und andere Organisationen mit neuen strategischen Überlegungen konfrontiert: Sind unsere Inhalte für die sprachgesteuerte Suche optimiert? Und wenn wir weiter in die Zukunft blicken, wie sollten wir unsere Inhalte für künftige Interaktionsformen aufbereiten und klassifizieren? Ein neuer Marketingbereich ist bereits in der Entstehung: Voice Search Optimization (VSO) ist die neue Suchmaschinenoptimierung (SEO), denn Unternehmen müssen sich Gedanken darüber machen, wie ihre Inhalte über verbale Schnittstellen bereitgestellt werden können.
Große Herausforderungen sind noch zu meistern
Es gibt noch viele ungeklärte Fragen in Bezug auf die Nutzung und die Erstellung von Inhalten für sprachgesteuerte Geräte. Aber es werden bereits wichtige Erfahrungen gesammelt und das Interesse an diesem Bereich wächst stetig. Nach wie vor gibt es offene Fragen dazu, was zu tun ist, wie es zu tun ist und wie man die größten Sprachbarrieren und Probleme lösen kann.
Es gibt Schwierigkeiten, die beste Art von Inhalten zu identifizieren, wie man mit den Nutzer:innen interagiert und wie man die Inhalte monetarisieren kann. Aber auch die Unterschiede in der Nutzung von sprachgesteuerten Technologien im Vergleich zur schriftlichen Interaktion auf anderen Medienkanälen sind eine große Herausforderung für die Produzierenden. Hinsichtlich der Kenntnisse und Fähigkeiten, die für die Arbeit in diesem Bereich erforderlich sind, verweisen die Fachleute auf solide Kommunikationskompetenzen, aber auch auf angewandte Fähigkeiten in der Multimedia-Produktion, ein gewisses technologisches Know-how und eine intensive Nutzung der digitalen Medien.
Auch die Themen Ethik und Datenschutz stehen zur Diskussion.
Aber der Weg für die Entwicklung dieses Bereichs ist geebnet, und das Verständnis seines Wertes und Potenzials ist für den Journalismus von entscheidender Bedeutung.
Dieser Text entstand im Rahmen des EU-geförderten Projekts „NEWSREEL2 – New Teaching Fields for the Next Generation of Journalists“. Unter Federführung des Erich-Brost-Instituts führte das Netzwerk von Wissenschaftler:innen aus Deutschland, Portugal, Rumänien, Tschechien und Ungarn unter anderem Forschungen zu Innovationen im Journalismus, Storytelling in sozialen Medien, grafischem Journalismus, Fact-Checking, Desinformation, dem Einsatz von künstlicher Intelligenz und Sprachassistenten im Journalismus, sowie der Rolle der Medien in der zeitgenössischen digitalen Demokratie durch. Darauf basierend entwickelt das Forscher:innenteam E-Learning-Materialien zu den verschiedenen journalistischen Feldern.
Bildquelle: Pixabay
Schlagwörter:Alexa, Künstliche Intelligenz (KI), Spracherkennung, Technologie, Voice recognition