Mark Jackley | Content Strategist | 16. Februar 2024
Ein Large Language Model (LLM) ist eine zunehmend beliebte Art künstlicher Intelligenz, die darauf ausgelegt ist, menschenähnliche schriftliche Antworten auf Anfragen zu generieren. LLMs werden anhand großer Mengen von Textdaten trainiert und lernen, das nächste Wort oder die nächste Wortfolge auf der Grundlage des bereitgestellten Kontexts vorherzusagen – sie können sogar den Schreibstil eines bestimmten Autors oder Genres nachahmen.
LLMs sorgten bereits Anfang der 2020er Jahre für Schlagzeilen, als sie aus Laboren kamen. Seitdem haben sie sich sowohl zu eigenständigen Produkten als auch zu wertschöpfenden Funktionen entwickelt, die in viele Arten von Unternehmenssoftware eingebettet sind. Dank ihrer beeindruckenden Fähigkeit, Anfragen zu interpretieren und hilfreiche Antworten zu generieren, werden LLMs in einer Vielzahl von Anwendungen eingesetzt, darunter natürliche Sprachverarbeitung, maschinelle Übersetzung, Inhaltsgenerierung, Chatbots und Dokumentenzusammenfassung.
Ein Large Language Model (LLM) ist ein künstliches Intelligenzsystem, das auf einem riesigen Datensatz trainiert wurde, der oft aus Milliarden von Wörtern aus Büchern, dem Internet und anderen Quellen besteht, um menschenähnliche, kontextbezogene Antworten auf Anfragen zu generieren. Da LLMs darauf ausgelegt sind, Fragen – in der LLM-Terminologie „Prompts“ genannt – zu verstehen und Antworten in natürlicher Sprache zu generieren, können sie Aufgaben wie die Beantwortung von Kundenfragen, die Zusammenfassung von Informationen in einem Bericht, die Erstellung erster Entwürfe von E-Mails und sogar das Schreiben von Gedichten und Computercode übernehmen. LLMs verfügen in der Regel über ein tiefes Verständnis der Grammatik und Semantik der Sprache, in der sie ausgebildet wurden, und können mithilfe der unternehmenseigenen Daten verfeinert werden.
Da sie die menschliche Sprache erkennen und interpretieren können – wenn auch nicht wirklich so verstehen, wie Menschen es tun – stellen LLMs einen bedeutenden Fortschritt in der Verarbeitung natürlicher Sprache dar. Das bekannteste LLM ist wahrscheinlich ChatGPT, das KI-Programm von OpenAI, das mit Milliarden von Wörtern aus Büchern, Artikeln und Websites trainiert wurde. Das Unternehmen bietet direkten Zugriff auf ChatGPT über einen Webbrowser oder eine mobile App oder kann über programmierbare APIs mit Unternehmenssoftware verknüpft werden. Andere gängige LLMs sind Cohere, GPT-4 und BARD.
Die Textdaten, die zum Trainieren eines LLM verwendet werden, können wie in einer Datenbank strukturiert oder unstrukturiert sein. Die meisten Unternehmen verfügen über große Mengen unstrukturierter Daten, darunter Textnachrichten, E-Mails und Dokumente.
Zu den beliebten geschäftlichen Einsatzmöglichkeiten von LLMs gehören Chatbots für den Kundenservice, digitale Assistenten und Übersetzungsdienste, die kontextbezogener, umgangssprachlicher und natürlicher klingen als herkömmliche wörtliche Übersetzungstools. LLMs können außerdem relativ komplexe Aufgaben ausführen, wie z. B. die Vorhersage von Proteinstrukturen und das Schreiben von Software-Code. Gesundheitswesen, Pharmaindustrie, Finanzwesen und Einzelhandel gehören zu den Branchen, die LLMs sinnvoll einsetzen. Ein Gesundheitsdienstleister könnte beispielsweise ein LLM verwenden, um Patienten zu triagieren, die sich bei einer Hotline melden, während eine Investmentgesellschaft ein LLM verwenden könnte, um Gewinnberichte, Nachrichten und Social-Media-Beiträge zu sichten und zusammenzufassen, um Börsentrends zu erkennen. LLMs können Organisationen bei der Verwaltung und Analyse von Daten unterstützen und Erkenntnisse gewinnen, die einen Mehrwert für das Unternehmen schaffen können. In beiden Szenarien erledigt das LLM die Aufgabe schneller, als es menschliche Analysten je könnten.
Das hat zu einem großen Interesse an der Technologie geführt, und zwar so sehr, dass der globale Markt für LLMs laut einer Studie von Valuates Reports aus dem Jahr 2023 bis 2029 voraussichtlich mit einer durchschnittlichen jährlichen Wachstumsrate von 21,4 % auf 40,8 Milliarden US-Dollar wachsen wird.
Bei der Diskussion über LLMs sind einige Schlüsselkonzepte zu verstehen. Sie umfassen:
Wie Menschen sind auch LLMs nicht perfekt. Die Qualität ihrer Ergebnisse hängt von der Qualität ihrer Eingaben ab, d. h. von den Informationen, die für ihr Training verwendet werden. Veraltete Daten können zu Fehlern führen, z. B. wenn ein Chatbot eine falsche Antwort zu den Produkten eines Unternehmens gibt. Ein Mangel an ausreichenden Daten kann dazu führen, dass LLMs Antworten erfinden oder „halluzinieren“. LLMs sind zwar großartig darin, Vorhersagen zu treffen, aber sie sind weniger gut darin, zu erklären, wie sie zu einem bestimmten Ergebnis gekommen sind. Und viele LLMs werden mit Büchern, Zeitungsartikeln und sogar Wikipedia-Seiten geschult, was zu Bedenken hinsichtlich Urheberrechtsverletzungen führt. Bei unzureichender Kontrolle können LLMs zu Sicherheitsproblemen führen, indem sie beispielsweise sensible oder persönliche Informationen in einer Antwort verwenden.
Eine KI-Technik namens „Retrieval-Augmented Generation“ (RAG) kann bei einigen dieser Probleme helfen, indem sie die Genauigkeit und Relevanz der Ausgabe eines LLM verbessert. RAG bietet eine Möglichkeit, gezielte Informationen hinzuzufügen, ohne das zugrunde liegende Modell zu ändern. RAG-Modelle erstellen Wissensdatenbanken – in der Regel auf der Grundlage der eigenen Daten einer Organisation –, die kontinuierlich aktualisiert werden können, um zeitnahe, kontextbezogene Antworten zu liefern. Chatbots und andere dialogorientierte Systeme könnten beispielsweise RAG verwenden, um sicherzustellen, dass ihre Antworten auf Kundenfragen auf aktuellen Informationen über den Lagerbestand, die Präferenzen des Käufers und frühere Einkäufe basieren, und um Informationen auszuschließen, die veraltet oder für den beabsichtigten betrieblichen Kontext des LLM irrelevant sind.
Die Einrichtung eines KI-Kompetenzzentrums vor Beginn des unternehmensspezifischen Trainings erhöht die Erfolgswahrscheinlichkeit. Unser E-Book erklärt warum und bietet Tipps zum Aufbau eines effektiven CoE.
Welche sind die fünf wichtigsten Large Language Models?
Experten sind sich zwar über die besten LLMs uneinig, aber fünf, die von vielen angepriesen werden, sind GPT-4 von OpenAI, Claude 2 von Anthropic, Llama 2 von Meta, Orca 2 von Microsoft Research und Command von Cohere. ChatGPT stammt ebenfalls von OpenAI.
Worin besteht der Unterschied zwischen LLMs und KI?
Künstliche Intelligenz ist ein weit gefasster Begriff, der viele Technologien umfasst, die menschenähnliches Verhalten oder Fähigkeiten nachahmen können. Large Language Models sind eine Art generative KI, der Oberbegriff für KI-Modelle, die Inhalte wie Text, Bilder, Videos, gesprochene Sprache und Musik generieren.