Künstliche Intelligenz: Large Language Models (LLM)

2. Juni 2024 Claudia Hilker

Meine Kunden in der Beratung zur “Künstlichen Intelligenz” fragen mich oft: “Was sind ‘Large Language Models (LLM)?'” In der KI-Welt tobt ein Wettrennen um die Vorherrschaft bei der Verarbeitung natürlicher Sprache. Large Language Models (LLMs) sind die Protagonisten dieses Rennens, die mit ihrer Fähigkeit, menschenähnliche Texte zu generieren und zu verstehen, die Grenzen des Möglichen immer weiter verschieben. Doch welches Modell hat die Nase vorn? Tauchen wir ein in die faszinierende Welt der LLMs.

Künstliche Intelligenz: Was ist ein Large Language Model?

Large Language Models (LLMs) sind hochentwickelte KI-Systeme, die darauf ausgelegt sind, menschliche Sprache in Textform zu verarbeiten, zu verstehen und zu generieren. Basierend auf Deep-Learning-Techniken und riesigen Datensätzen mit Milliarden von Wörtern aus verschiedenen Quellen, erfassen diese Modelle die Feinheiten von Sprache, Grammatik, Kontext und Allgemeinwissen.

Ob Fragen beantworten, Texte zusammenfassen, Sprachen übersetzen oder sogar interaktive Gespräche führen – LLMs meistern eine Vielzahl von Aufgaben mit bemerkenswerter Kompetenz.

Was ist der Unterschied zwischen proprietäre und Open-Source LLM?

Bei den LLMs gibt es eine klare Unterscheidung zwischen proprietären und Open-Source-Modellen. Proprietäre Modelle wie GPT-3 von OpenAI oder PaLM von Google werden von Technologie-Unternehmen entwickelt und sind in der Regel nur über kostenpflichtige APIs zugänglich.

Im Gegensatz dazu stehen Open-Source-Modelle wie BLOOM von Hugging Face oder LLaMA von Meta, die frei verfügbar und von der Community weiterentwickelt werden können. Während proprietäre Modelle oft eine höhere Leistung und bessere Ressourcen bieten, ermöglichen Open-Source-LLMs eine größere Transparenz, Anpassbarkeit und gemeinschaftliche Weiterentwicklung.

Welche Bestandteile haben LLMs?

Du siehst in dieser Grafik die Bestandteile von LLMs wie “Emerging, Basic, Augmented” und die LLM-Arten wie Meta, OpenAI und Google. Die Erläuterung der Fachbegriffe folgt. Bildquelle: https://genai.works/

Was sind die LLM-Bestandteile im Detail?

Retrieval Augmented Generation (RAG): Eine Methode, bei der ein Informationsabrufmodul mit einem Textgenerierungsmodell kombiniert wird. Dadurch können LLMs auf externe Wissensquellen zugreifen und ihre Antworten mit aktuellen und relevanten Informationen anreichern.
Reinforcement Learning from Human Feedback (RLHF): Ein Verfahren, bei dem LLMs anhand von Datensätzen mit menschlichen Präferenzen weiter feinabgestimmt werden, um ihre Ausgaben zu verbessern.
Instruction Tuning: LLMs lernen, korrekte Antworten auf Basis von menschlichen Korrekturen einiger Beispiele zu generieren.
Mixture of Experts (MoE): Eine Technik, bei der sehr große LLMs in kleinere spezialisierte Modelle aufgeteilt werden, um Ressourcen effizienter zu nutzen.

Welche großen Large Language Models gibt es?

Meta LLMs wie LLaMA und LLaMA 2: Von Meta AI entwickelte Open-Source-LLMs, die für Feinabstimmung und kommerzielle Nutzung verfügbar sind.

OpenAI LLMs wie GPT-4 und ChatGPT: Leistungsstarke proprietäre LLMs von OpenAI, die über APIs zugänglich sind (teilweise kostenpflichtig).

Google LLMs wie LaMDA und PaLM: Googles proprietäre LLM-Entwicklungen, die in einigen Google-Produkten zum Einsatz kommen.Es gibt auch viele Open-Source-LLMs von Universitäten und Forschungseinrichtungen wie Alpaca, Vicuna und Dolly 2, die als kostengünstige Alternativen dienen.

Zudem gibt es viele weitere kleinere LLM.

Welches LLM ist das Beste?

Die Antwort hängt von den spezifischen Anforderungen und Anwendungsfällen ab. Hier ist ein tabellarischer Überblick über einige der führenden LLMs und ihre Stärken. Bei Perplexity AI kann man beispielsweise das Tool so einstellen, dass das Tool die Entscheidung über das beste LLM wählt. Das bringt nach meinen langjährigen Erfahrungen die beste Ergebnisse in der Praxis. Hier ist eine Tabelle mit zusätzlichen Informationen zu den führenden Large Language Models mit Details.

Modell	Entwickler	Typ	Größe	Kontextfenster	Multilinguale Fähigkeiten	Besondere Stärken
GPT-4	OpenAI	Proprietär	175 Milliarden Parameter	32.768 Token	Gut	Allgemeine Leistungsfähigkeit, multimodal (Text und Bilder), strukturierte Antworten
PaLM	Google	Proprietär	540 Milliarden Parameter	64.000 Token	Sehr gut	Multilinguale Verarbeitung, Zusammenfassungen, Analysen
Claude	Anthropic	Proprietär	Unbekannt	1 Million Token	Gut	Riesiges Kontextfenster, Analysen, Codegenerierung, spezialisierte Modellvarianten
BLOOM	Hugging Face	Open Source	176 Milliarden Parameter	4.096 Token	Durchschnittlich	Vielseitigkeit, Community-Entwicklung, Anpassbarkeit
LLaMA	Meta	Open Source	65 Milliarden Parameter	4.096 Token	Gut	Effizienz, Anpassbarkeit, Leichtgewicht
OPT	Meta	Open Source	175 Milliarden Parameter	2.048 Token	Durchschnittlich	Offene Vortrainings-Modelle, Anpassbarkeit

Erläuterungen zu den Spalten für KI-Anfänger

Größe: Angabe der Anzahl an Parametern, die das Modell trainiert hat. Mehr Parameter bedeuten in der Regel höhere Leistungsfähigkeit, aber auch höheren Ressourcenverbrauch.
Kontextfenster: Die maximale Anzahl an Token (Wörtern), die das Modell auf einmal verarbeiten kann. Ein größeres Kontextfenster ermöglicht die Verarbeitung längerer und komplexerer Eingaben.
Multilinguale Fähigkeiten: Bewertet, wie gut das Modell mehrere Sprachen verarbeiten kann.
Besondere Stärken: Hebt die Hauptstärken und Anwendungsgebiete des jeweiligen Modells hervor.

Die Tabelle zeigt, dass sowohl proprietäre als auch Open-Source-Modelle ihre spezifischen Stärken und Schwächen haben. Während proprietäre Modelle oft leistungsfähiger sind, bieten Open-Source-Lösungen mehr Flexibilität und Anpassbarkeit. Lerne, wie Künstliche Intelligenz funktioniert.

Zertifikatskurse für KI-Experten mit 90 % Förderung für Freelancer

Bring dein Business mit KI auf ein neues Level! Bilde dich weiter als KI-Manager oder KI-Berater. Erfahre mehr dazu im Webinar: KI-Kurse mit 90 Prozent staatlicher Förderung für Freelancer.

Claudia Hilker

Dr. Claudia Hilker ist Expertin für KI-Beratung und Digital Marketing im B2B-Bereich Mit fundiertem Wissen in BWL, IT und Marketing entwickelt sie transformative KI-Strategien für digitale Geschäftserfolge. Als Bestseller-Autorin und Dozentin in bietet sie zudem praxisnahe Schulungen an. Ihre Mission ist es, die digitale Transformation von B2B-Unternehmen vorantreiben. Abonniere ihren Newsletter und folge ihr auf LinkedIn.

Künstliche Intelligenz: Large Language Models (LLM)

Künstliche Intelligenz: Was ist ein Large Language Model?