Generative AI – Servicefunktionen

Themen zu Features

Modelle
Dedicated AI-Cluster
Chat-API und Playground
LangChain-Integration
LlamaIndex-Integration
Generative KI-Vorgänge
OCI Generative AI für Oracle Cloud Applications

Modelle

Zu den Modellen von Cohere und Meta für OCI Generative AI gehören folgende:

Cohere Command R: Als Teil einer neuen Kategorie skalierbarer Modelle zielt Command R darauf ab, hohe Effizienz und hohe Genauigkeit für Retrieval-Augmented Generation(RAG)-Anwendungen auszugleichen. Im Vergleich zu den ursprünglichen Cohere-Modellen bietet Command R einen höheren Durchsatz und eine geringere Latenz, ein größeres Kontextfenster und eine starke Leistung in 10 Sprachen.
Cohere Command R+: Cohere Command R+ wurde durch zusätzliches Training von Command R für speziellere Anwendungsfälle erweitert. Command R+ bietet ein tieferes Verständnis der Sprache und kann nuanciertere und kontextbezogenere Antworten generieren. Verwenden Sie Command R+ für Anwendungsfälle wie das Generieren von Langforminhalten, Zusammenfassungen, die Beantwortung von Fragen und die Sprachgenerierung für bestimmte Domains oder Branchen.
Cohere Embed: Diese englischen und mehrsprachigen Einbettungsmodelle (v3) konvertieren Text in eine Vektoreinbettungsdarstellung. Die „Light“-Versionen von Embed sind kleiner und schneller (nur auf Englisch verfügbar).
Meta Llama 3.1: Llama 3.1-Modelle sind modern und Open Source mit verbesserter Performance und Reaktionsvielfalt. Zu den verbesserten Funktionen gehören ein 128K-Kontextfenster und die Unterstützung von acht Sprachen. OCI Generative AI bietet die Modelle Llama 3.1 70B und 405B mit Unterstützung für die Feinabstimmung mithilfe der Low-Rank-Adaptation-Methode (LoRA) an.
Meta Llama 3.2: Durch multimodale Unterstützung können diese Modelle bildbasierte Anwendungsfälle realisieren, wie z. B. das Zusammenfassen von Diagrammen und Grafiken und das Schreiben von Bildunterschriften für Bilder und Abbildungen. Darüber hinaus bieten die Llama 3.2-Modelle mehrsprachige Unterstützung für acht Sprachen bei reinen Textabfragen. OCI Generative AI bietet sowohl das Modell Llama 3.2 90B als auch das Modell 11B an.

Dedicated AI-Cluster

Mit Dedicated AI-Clustern können Sie grundlegende Modelle auf dedizierten GPUs hosten, die nur Ihnen zur Verfügung stehen. Solche Cluster bieten eine stabile Leistung mit hohem Durchsatz, die für Produktionsanwendungen erforderlich ist, und unterstützen das Hosting und die Feinabstimmung von Workloads. OCI Generative AI ermöglicht es Ihnen, Ihren Cluster ohne Ausfallzeiten zu skalieren, um Volumenschwankungen zu bewältigen.

Chat-API und Playground

Das Chat-Erlebnis bietet eine einsatzbereite Schnittstelle mit Cohere- und Meta-Modellen, in der Benutzer Fragen stellen und gesprächsorientierte Antworten über die OCI-Konsole oder -API erhalten können.

LangChain-Integration

OCI Generative AI enthält LangChain, ein Open-Source-Framework, das für die Entwicklung neuer Schnittstellen für generative KI-Anwendungen auf der Grundlage von Sprachmodellen verwendet werden kann. LangChain vereinfacht den Austausch von Abstraktionen und Komponenten, die für die Arbeit mit Sprachmodellen erforderlich sind.

LlamaIndex-Integration

Verwenden Sie LlamaIndex, ein Open-Source-Framework, zum Erstellen kontextabhängiger Anwendungen mit OCI Generative AI, um RAG-Lösungen oder -Agents einfach zu erstellen. Bringen Sie Ihre Lösungen mit benutzerdefinierten Datenquellen und flexiblen Tools vom Prototyp zur Produktion.

Generative KI-Vorgänge

OCI Generative AI bietet Kontrollmechanismen für die Inhaltsmoderation. Demnächst verfügbar ist außerdem der Austausch von Endpunktmodellen ohne Ausfallzeiten sowie die Möglichkeit, Endpunkte zu deaktivieren und zu aktivieren. Für jeden Modellendpunkt erfasst OCI Generative AI zudem eine Reihe von Analysen, darunter Anrufstatistiken, verarbeitete Token und Fehlerzahlen.

OCI Generative AI for Oracle Fusion Cloud Applications

Durch die direkte Einbettung von mit OCI Generative AI erstellten Funktionen in seine Geschäftsanwendungen stellen wir unseren Kunden ganz einfach sofort KI-gesteuerte Funktionen ohne komplexe Integrationen zur Verfügung.

Weitere Informationen