Verfügbare KI-Modelle

GPT 5.2 Pro

Ist das leistungsstärkste Produktionsmodell der GPT-5.2-Familie von OpenAI und wird über die Responses API für Workloads mit höchsten Anforderungen an Genauigkeit, Schlussfolgern, Tool-Nutzung sowie Kontext und Durchsatz bereitgestellt.

GPT 5.2 chat

Ist der chatoptimierte Snapshot der GPT-5.2-Familie von OpenAI (in ChatGPT als GPT-5.2 Instant bekannt) und eignet sich für interaktive Anwendungen mit Bedarf an Geschwindigkeit, langen Kontexten, multimodalen Eingaben und stabilem Dialogverhalten.

GPT 5.2

Ressourcenschonende Mikro-Version von GPT-4.1, optimiert für leichtgewichtige Anwendungen und hohe Request-Raten.

Sora 2 Pro

Sora 2 Pro ist ein leistungsstarkes Modell zur Mediengenerierung, das aus Text oder Bildern dynamische Videos mit synchronisiertem Audio erzeugt.

Sora 2

Äußerst leistungsstarkes Modell zur Videogenerierung mit Soundeffekten, unterstützt Chat-Format.

GPT Image 1.5

GPT-Image-1.5 ist ein multimodales GPT-Modell zur Bildgenerierung aus Textprompts und präzisen Bearbeitungen von Eingabebildern gemäß Nutzeranweisungen.

GPT 4.1

Kontextoptimiertes OpenAI-Modell für umfangreiche Dokumente, tiefgehendes Research und komplexe Coding-Aufgaben.

GPT 4.1 Mini

Optimierte, ressourcenschonende Variante von GPT-4.1, gleicher Kontextumfang wie das Originalmodell.

GPT 4.1 Nano

Ressourcenschonende Mikro-Version von GPT-4.1, optimiert für leichtgewichtige Anwendungen und hohe Request-Raten.

GPT 4o

Ein modernes, multimodales Spitzenmodell für Echtzeitverarbeitung von Text, Audio und Bild, das durch hohe Intelligenz und beeindruckende Leistungsfähigkeit besticht.

GPT 4o Mini

Eine schnelle und kostengünstige Variante von GPT-4o, die durch exzellentes logisches Denken und Multimodalität überzeugt – perfekt für skalierbare und effiziente Anwendungen.

GPT Image 1

OpenAIs fortschrittliche Engine zur Generierung und Bearbeitung von Bildern aus Text, optimiert für hohe Realismus- und Variationsvielfalt.

GPT o3

Optimiertes Modell für strukturiertes Reasoning und die Bearbeitung komplexer, mehrstufiger Logikprozesse.

GPT o3-mini

Optimierte o3-Version mit Fokus auf Kostenersparnis und effizienter Leistung.

GPT o4-mini

Optimiertes Multimodalmodell mit hoher Verarbeitungsgeschwindigkeit, erweitertem Reasoning und Coding-Unterstützung.

GPT o4-mini-high

Optimierte High-Performance-Variante von o4-mini, speziell für umfangreiche Aufgaben und komplexe logische Prozesse.

GPT-OSS 120B

Erstes Open-Source-Modell von OpenAI, optimiert für hohe Performance und MXFP4-natives Training.

Gemma 3 27B Instruct

Ein schlankes Multimodal-KI-Modell mit ausgezeichneter Kontextverarbeitung und umfassender Mehrsprachigkeits-
unterstützung.

Gemini-3-flash

Ist ein leichtgewichtiges, effizientes, multimodales Modell von Google, das für reale Anwendungen mit schnellen Antworten und geringer Latenz entwickelt wurde.

Nano Banana Pro

Ist ein hochmodernes Modell für die visuelle Erstellung und Bearbeitung. Im Gegensatz zu rein textbasierten Modellen liegt sein Fokus auf der Transformation kreativer Konzepte in hochauflösende Bilder. Es unterstützt komplexe Workflows im Bereich Design, Marketing und digitale Kunst.

Gemini 3 Pro

Leistungsstarkes Modell für Programmierung, Mathematik und logisches Denken, mit Deep Think-Modus für mehrstufige Problemlösungen.

Gemini 2.5 Pro

Hauptmodell für Analyse und Verarbeitung langer Kontexte (bis zu 1 Mio. Token), verfügbar in Gemini Advanced.

Gemini 2.5 Flash-Lite

Kosteneffiziente Variante für Aufgaben mit minimaler Latenz.

Gemini 2.5 Flash

Hochleistungsmodell von Google zur multimodalen Verarbeitung von Text, Bild, Audio und Video, optimiert für komplexe Analyse, Research und tiefgehendes Reasoning.

Veo 3 Pro

Ist ein Videomodell in Produktionsqualität mit hoher Wiedergabetreue, nativem Ton und erweitertem Tooling.

Imagen 4 Pro

Fortgeschrittenes Modell für generative Bild-KI, optimiert für ein ausgewogenes Verhältnis von Renderqualität und Verarbeitungsgeschwindigkeit.

Imagen 4 Ultra

Hochleistungs-Bildmodell von Google, optimiert für präzises Editing, stilistische Anpassungen und treue Umsetzung von Textvorgaben.

Imagen 4 Fast

Optimiertes Bildgenerierungsmodell, ausgelegt für hohe Geschwindigkeit und parallele Verarbeitung großer Datenmengen.

Imagen 4 Pro

Fortgeschrittenes Modell für generative Bild-KI, optimiert für ein ausgewogenes Verhältnis von Renderqualität und Verarbeitungsgeschwindigkeit.

Imagen 4 Ultra

Hochleistungs-Bildmodell von Google, optimiert für präzises Editing, stilistische Anpassungen und treue Umsetzung von Textvorgaben.

Сlaude Sonnet 4.5

Claude Sonnet 4.5 verbessert die Fähigkeiten für praktische Computeraufgaben erheblich: Auf OSWorld stieg es von 42,2 % (Sonnet 4) auf 61,4 % an die Spitze. Die Claude for Chrome-Erweiterung nutzt diese Verbesserungen direkt.

Claude Opus 4.5

Ist ein instruktionsoptimiertes Modell von Anthropic für komplexes Schlussfolgern, Programmierung und Multi-Turn-Dialoge, mit erweiterten Kontext-, Tool- und RAG-Funktionen, strukturierten Ausgaben und Sicherheitskontrollen.

Claude Haiku 4.5

Schnellstes und kosteneffizientestes Modell.

Claude Opus 4

Anthropics führendes Flaggschiff-Modell für hochkomplexe Aufgaben, Funktionsaufrufe, agentische Anwendungsfälle und Code-Generierung.

Claude Sonnet 4

Ein leistungsstarkes, harmonisch abgestimmtes KI-Modell für komplexes logisches Denken, professionelle Code-Erstellung und umfangreiche Analysen – multimodal mit visuellen Fähigkeiten und ideal als vielseitiges Allround-System für den täglichen Einsatz.

Claude Sonnet 3.7

Ausgewogenes Modell mit Tool-CoT, Vision und Reasoning; Vorgänger von Claude Sonnet 4.

Claude Sonnet 3.5

Ein ausgewogenes KI-Modell mit leistungsstarkem Tool-Calling, fortschrittlicher Vision und intelligenter Performance.

Llama 3.3 70B Instruct

Ein leistungsfähiges Open-Source-Instruktionsmodell für Dialoge, präzises Q&A und flexible Content-Generierung.

Llama Guard 3 8B

Open-Source-Sicherheitsfilter zur Inhaltsmoderation (toxische, illegale Inhalte usw.).

DeepSeek V3.2

DeepSeek v3.2 ist ein großes, auf Schlussfolgern ausgerichtetes Sprachmodell für lange Kontexte, Agenten-/Tool-Nutzung, fortgeschrittenes Schlussfolgern, Programmierung und Mathematik.

Deepseek R1 Llama 70B

Destilliertes Open-Source-Modell DeepSeek R1 (Llama 3.3 70B als Basismodell), optimiert für Reasoning.

Deepseek R1

Ein offen zugängliches Reasoning-Modell, ausgelegt für die Verarbeitung sehr großer Kontexte sowie anspruchsvolle Anwendungen in Wissenschaft, Logik und Mathematik.

Mistral Large

Mistrals Spitzenmodell, entwickelt für anspruchsvolle Einsatzszenarien und professionelle Code-Erstellung.

Mistral Medium

Ein flexibel einsetzbares KI-Modell für umfassende Sprachverarbeitung, Software-Erstellung und anspruchsvolle logische Schlussfolgerungen.

Mistral Moderation

Klassifizierungsmodell zur Unterstützung von Inhaltsmoderation und Sicherheitsbewertung.

Mistral OCR

Leistungsstarkes OCR-Modell von Mistral zur effizienten und präzisen Verarbeitung von Dokumenten.

Mistral Small

Leistungsstarkes Modell für blitzschnelle, präzise Antworten und zuverlässige Funktionsaufrufe.

Pixtral Large

Multimodales KI-Modell für die Analyse visueller und tabellarischer Daten, Frage-Antwort-Systeme und strukturiertes Dokumentenverständnis.

Magistral Small

Open-Source-Modell für strukturiertes Reasoning, optimiert für langkettige logische Abläufe und vielseitige Aufgaben.

Magistral Medium

Effizientes Modell mit ausgewogener Größe und Rechenleistung, optimiert für Vision-basierte Reasoning-Aufgaben und mehrstufige Logikprozesse.

Magistral Large

Hochskalierbares Reasoning-Modell von Mistral, optimiert für komplexe Problemlösungen und anspruchsvolles Denken

Whisper Large v3

Bewährtes Modell für akkurate Transkription von Sprache in Text, optimiert für hohe Genauigkeit.

Qwen 3 235B-A22B

Apache-20 Mixture-of-Experts-Modell mit 22B aktiven Parametern, spezialisiert auf mehrsprachige Verarbeitung und strukturiertes Reasoning.

Qwen 3 32B

Open-Source-Midrange-Modell, optimiert für Textanalyse, strukturiertes Reasoning und die Nutzung externer Tools.

Sonar Pro

Großes Kontextmodell mit 200K Token, optimiert für effiziente Informationssuche, Frage-Antwort-Systeme und konsistente Antwortqualität.

Sonar Reasoning

Modell zur effizienten Bearbeitung analytischer Aufgaben, optimiert für mehrstufiges Reasoning (COT) und nachvollziehbare Erklärungen.

Sonar Reasoning Pro

Optimierte Pro-Variante für strukturiertes Reasoning und Bearbeitung komplexer, mehrstufiger Logikketten.

Elevenlabs

Text-to-Speech-Modelle mit hoher Qualität, unterstützt multiple Sprecher und zahlreiche Sprachen für flexible Anwendungen.

FLUX 1.1 Kontext

Optimierte FLUX-Variante für Bildbearbeitung und -modifikation mit hoher Präzision.

FLUX 1.1 Pro

Hochpräziser Bildgenerator, proprietär, optimiert für realistische Bildgenerierung und konsistente Qualität.

FLUX 1.1 Schnell

Optimierte, ressourcenschonende Open-Source-Variante von FLUX für schnelle Bildverarbeitung.

Grok 3

KI-Assistent von xAI mit multimodaler Vision, Web-Integration, Reasoning-Fähigkeiten und aktuellem Wissensstand; Verhalten kann variabel sein.

Phi 4

Ressourcenoptimiertes Modell mit Fokus auf leistungsstarkes Reasoning, mathematische Berechnungen und schnelle Antwortzeiten.

Grok 4.1 Fast

KI-Assistent von xAI mit multimodaler Vision, Web-Integration, Reasoning-Fähigkeiten und aktuellem Wissensstand; Verhalten kann variabel sein.

Grok 4

KI-Modell mit Textmodalität (künftig Vision). Unterstützt extrem große Kontextfenster.

Grok 3 Mini

Leichtgewichtiges Modell mit reflektierenden Antworten, geeignet für logikbasierte Aufgaben.