Caracteristicile Data Science Service

Încercați gratuit un laborator de știință a datelor

Caracteristici esențiale

Pregătirea datelor
Crearea modelelor
Instruirea modelelor
Organizarea și gestionarea modelelor
Automatizare și MLOps
Acţiuni rapide AI

Pregătirea datelor

Acces flexibil la date

Experții în date pot accesa și utiliza orice sursă de date, în orice cloud sau on-premises. Astfel, sunt disponibile mai multe date potențiale, care conduc la modele mai bune.

Etichetarea datelor

Oracle Cloud Infrastructure (OCI) Data Labeling este un serviciu de creare a unor seturi de date etichetate, pentru instruirea mai precisă a modelelor AI și machine learning. Prin OCI Data Labeling, dezvoltatorii și experții în date colectează date, creează și parcurg seturi de date și aplică etichete înregistrărilor de date.

Aflați mai multe despre OCI Data Labeling

Pregătirea datelor la scară cu Spark

Trimiteți interogări Spark interactive către clusterul OCI Data Flow Spark. Sau utilizați Oracle Accelerated Data Science SDK pentru a dezvolta cu ușurință o aplicație Spark și a o rula apoi la scară, pe OCI Data Flow, totul din mediul Data Science.

Bază de caracteristici (cu previzualizare)

Stabiliți fluxurile de proiectare a caracteristicilor și generați caracteristici cu execuție gestionată complet. Creați versiuni și documente atât pentru caracteristici, cât și pentru fluxurile de caracteristici. Partajați, organizați și controlați accesul la caracteristici. Consumați caracteristici pentru scenarii de inferență atât în set, cât și în timp real.

Crearea modelelor

Interfață JupyterLab

Mediile JupyterLab, de tip notebook, integrate și găzduite în cloud, le permit echipelor de experți în date să creeze și să instruiască modele folosind o interfață cu utilizatorul foarte familiară.

Frameworkuri open source de machine learning

OCI Data Science le oferă experților în date familiaritate și versatilitate, datorită sutelor de instrumente și frameworkuri open source populare, cum ar fi TensorFlow sau PyTorch, dar și posibilității de adăugare a altor frameworkuri. Datorită parteneriatului strategic dintre OCI și Anaconda, utilizatorii OCI pot să descarce și să instaleze gratuit pachete direct din depozitul Anaconda, astfel încât mediul open source securizat devine mai accesibil ca oricând.

Anaconda anunță parteneriatul strategic în cloud cu Oracle, pentru inovarea perfectă și securizată a mediului open source din cloud

Biblioteca Oracle Accelerated Data Science (ADS)

Oracle Accelerated Data Science SDK este un set de instrumente Python ușor de utilizat, care sprijină experții în date pe parcursul întregului lor flux de lucru.

Oracle Accelerated Data Science - SDK

Instruirea modelelor

Hardware puternic, inclusiv unități de procesare grafică (GPU)

Cu procesoarele grafice NVIDIA, experții în date pot crea și instrui modele de învățare structurată într-un timp mai scurt. Vitezele de performanță pot fi de 5 până la 10 ori mai mari.

Jobs

Utilizați Jobs pentru a rula seturi de sarcini de știință a datelor repetabile. Scalați resursele de instruire a modelelor cu suport pentru GPU bare metal NVIDIA și instruire distribuită.

Editare în consolă a artefactelor de joburi

Creați, editați și rulați cu ușurință artefacte de job Data Science direct din consola OCI, folosind editorul de coduri. Vine cu integrare Git, upgrade automat, personalizare și multe altele.

Optimizarea estimatoarelor și a ADSTuner

Organizarea și gestionarea modelelor

Catalog de modele

Experții în date utilizează catalogul de modele pentru a păstra și partaja modelele de machine learning finalizate. Catalogul stochează artefactele și captează metadatele despre taxonomie și contextul modelului, hiper-parametri, definițiile schemelor de date de intrare și rezultatele modelului și informații detaliate despre proveniența modelului, inclusiv codul sursă și mediul de instruire.

Evaluarea și compararea modelelor

Generați automat o suită complexă de parametri și vizualizări pentru a măsura performanța modelului în raport cu datele noi și a compara candidații la model.

Medii reproductibile

Utilizați mediile conda predefinite, organizate pentru a rezolva o varietate de cazuri de utilizare, cum ar fi NLP, viziunea computerizată, prognoza, analiza graficelor și Spark. Publicați medii personalizate și le partajați cu colegii, asigurând reproductibilitatea mediilor de instruire și inferență.

Caracteristică nouă de mediu conda disponibilă în OCI Data Science

Cu control al versiunilor

Experții în date se pot conecta la depozitul Git al organizației lor pentru a păstra și prelua activitatea de machine learning.

Automatizare și MLOps

Implementarea modelului gestionat

Implementați modelele de machine learning ca puncte finale HTTP pentru deservirea predicțiilor de modele pentru datele noi în timp real. Pur și simplu, faceți clic pentru a implementa din catalogul de modele, iar OCI Data Science gestionează toate operațiunile de infrastructură, inclusiv alocarea computerelor și echilibrarea traficului.

Procese ML

Operaționalizați și automatizați fluxurile de lucru pentru crearea, instruirea și implementarea modelelor cu un serviciu gestionat complet, astfel încât să creați, să remediați erorile, să urmăriți, să gestionați și să executați fluxuri ML.

Monitorizare ML

Monitorizați continuu modelele din producție, pentru a detecta devierea de date și de concepte. Le permite experților în date, inginerilor de fiabilitate a site-urilor și inginerilor DevOps să primească alerte și să evalueze rapid necesitățile de reinstruire a modelului.

Aplicații ML

Proiectată inițial pentru aplicațiile SaaS proprii ale Oracle, pentru încorporarea caracteristicilor AI, aplicațiile ML sunt acum disponibile pentru automatizarea întregului ciclu de viață MLOps, inclusiv pentru dezvoltare, asigurarea accesului, mentenanță continuă și gestionarea flotei, pentru furnizori de servicii de internet cu sute de modele pentru fiecare dintre miile lor de clienți.

Acţiuni rapide AI

Acces fără cod de programare

Utilizați LLM-uri de la Mistral, Meta și altele fără a scrie o singură linie de cod printr-o interfață perfectă în notebook-urile OCI Data Science.

Importați orice LLM din OCI Object Storage, apoi optimizați și implementați printr-o interfață cu utilizatorul ușor de utilizat.

Implementare

Implementați LLM-uri cu câteva clicuri, alimentate de servere de inferență populare, cum ar fi vLLM (de la UC Berkeley), inferență de generare a textului (de la Hugging Face) sau TensorRT-LLM (de la NVIDIA), pentru performanțe optime.

Optimizare

Pentru a obține performanțe optime, utilizați instruirea distribuită cu PyTorch, Hugging Face Accelerate sau DeepSpeed pentru lLM-uri de optimizare. Activaţi stocarea ponderilor optimizate cu stocarea obiectelor. În plus, Condas furnizat de servicii elimină cerința pentru mediile Docker personalizate și permite partajarea cu o încetinire mai mică.

Evaluare

Produceți rapoarte de evaluare detaliate pentru LLM-ul dvs., bazate pe BERTScore sau pe understudy orientat spre rechemare pentru evaluarea Gisting (ROUGE), pentru a vă ajuta să înțelegeți cum se compară performanța modelului cu alte modele.

Această pagină a fost tradusă automat.