Text: Medien.Daten
3.8 Anwendungsfelder von Deep Learning: Das Beispiel Sprachmodelle
Wenn man sich mit Programmen der Spracherkennung, der Übersetzung von Texten oder der Generierung von Texten befasst, bewegt man sich im Feld der großen Sprachmodelle. Diese bezeichnet man im Englischen als Large Language Models oder kurz LLMs. Große Sprachmodelle basieren auf Deep-Learning-Algorithmen und werden auf Basis enorm großer Datenmengen trainiert. Die LLMs zählen zu dem Forschungsfeld, dass sich speziell mit der Entwicklung von Algorithmen des Natural Language Processing (NLP) befasst, sprich mit der Verarbeitung natürlicher Sprache. Große Aufmerksamkeit haben diese Modelle durch das bekannte Programm ChatGPT gewonnen (vgl. Fink 2023). Im November 2022 wurde der Chatbot ChatGPT veröffentlicht und damit der breiten Öffentlichkeit zur Verfügung gestellt. Der Chatbot wurde von OpenAI entwickelt und gilt mit seiner Technologie als ein fortschrittliches Sprachmodell. Die Idee von ChatGPT ist das Antworten auf von Nutzer*innen gestellte Fragen (sogenannten ›Prompts‹). Damit ChatGPT trainiert werden kann, um immer mehr neue Informationen zu lernen und wiedergeben zu können, wird eine große Menge an Textdaten in das Modell eingespeist, sodass es Beziehungen zwischen Wörtern und Sätzen erkennen lernt. Auf Grund der Größe der Textdaten kann der Chatbot Nuancen von Sprache lernen und entsprechend passende Antworten hervorbringen (vgl. Kalla/Smith 2023).
Neben ChatGPT gibt es noch weitere Chatbots, also Programme mit Künstlicher Intelligenz, um Unterhaltungen mit Menschen zu führen und auf Basis einer Unterhaltung zu lernen. Sie werden vielseitig als Kommunikationsmittel in Bereichen eingesetzt, in denen normalerweise Mitarbeitende eines Unternehmens als Ansprechpersonen dienen würden. Unternehmen setzen Chatbots vor allem aus Kostengründen ein, da dadurch Personalkosten in erheblichem Umfang gespart werden können. Gleichzeitig kann man auf diese Weise eine Rund-um-die-Uhr Betreuung gewährleisten (vgl. De Witt et al. 2020).
Es gibt zwei Funktionen von Chatbots. Die Einen sollen konkrete Aufgaben erledigen, für die sie programmiert wurden. So werden sie im Bereich der Hilfestellungen eingesetzt, wenn man als Kund*in Fragen technischer oder inhaltlicher Art hat, z.B. bei Bestellungen über einen Online-Shop (vgl. De Witt et al. 2020). Die andere Funktion dient der Unterhaltung. Chatbots unterhalten sich mittels Text oder Audio in menschenähnlicher Sprache. Sie können automatisierte Unterhaltungen durchführen, indem schnelle und präzise Antworten durch das System auf Nachfrage von Nutzer*innen gegeben werden können. Eine intuitive Nutzung wird durch die Nachahmung natürlicher Sprache gewährleistet. So kann ein Kundenservice verbessert werden, indem die Kundenzufriedenheit durch genauere Antworten gesteigert werden kann. Zudem werden Antworten personalisiert, indem sie den Interessen und Bedürfnissen der Nutzer*innen angepasst werden. Diese Anpassungsfähigkeit erlaubt es Unternehmen oder Organisationen, das System mit passenden Trainingsdaten zu versehen, um auf sie zugeschnittene Antworten für Nutzer*innen zu ermöglichen. Auch kann durch einen hohen Grad einer Skalierbarkeit (Größenveränderung) eine große Anzahl an Gesprächen gleichzeitig stattfinden. Dies bringt vor allem Vorteile für Bereiche mit sich, in denen viele Informationen parallel verarbeitet werden müssen (z.B. in großen Unternehmen).
Auch werden Chatbots zur Übersetzung von Sprache genutzt, was eine bedeutende Funktion für die globale Vernetzung darstellt (vgl. Kalla/Smith 2023). Dadurch, dass KI darauf ausgelegt ist, stetig weiterzulernen, ist eine zunehmende Verbesserung in den Antworten und der Sprache zu erwarten. Diese Übersetzungstechnik ist möglicherweise für Sie interessant, wenn Sie bspw. textbasierte Medien oder Audioaufnahmen für ein mehrsprachiges Publikum zugängig machen wollen. Ein Übersetzungsprogramm, das zuverlässig in verschiedene Sprachen übersetzen kann und dabei den Ansprüchen der DSGVO entspricht, ist DeepL (https://www.deepl.com/de/translator