Caracteristicile Data Science Service

Pregătirea datelor

Acces flexibil la date

Experții în date pot accesa și utiliza orice sursă de date, în orice cloud sau on-premises. Astfel, sunt disponibile mai multe date potențiale, care conduc la modele mai bune.

Etichetarea datelor

Oracle Cloud Infrastructure (OCI) Data Labeling este un serviciu de creare a unor seturi de date etichetate, pentru instruirea mai precisă a modelelor AI și machine learning. Prin OCI Data Labeling, dezvoltatorii și experții în date colectează date, creează și parcurg seturi de date și aplică etichete înregistrărilor de date.

Pregătirea datelor la scară cu Spark

Trimiteți interogări Spark interactive către clusterul OCI Data Flow Spark. Sau utilizați Oracle Accelerated Data Science SDK pentru a dezvolta cu ușurință o aplicație Spark și a o rula apoi la scară, pe OCI Data Flow, totul din mediul Data Science.

Bază de caracteristici (cu previzualizare)

Stabiliți fluxurile de proiectare a caracteristicilor și generați caracteristici cu execuție gestionată complet. Creați versiuni și documente atât pentru caracteristici, cât și pentru fluxurile de caracteristici. Partajați, organizați și controlați accesul la caracteristici. Consumați caracteristici pentru scenarii de inferență atât în set, cât și în timp real.

Crearea modelelor

Interfață JupyterLab

Mediile JupyterLab, de tip notebook, integrate și găzduite în cloud, le permit echipelor de experți în date să creeze și să instruiască modele folosind o interfață cu utilizatorul foarte familiară.

Frameworkuri open source de machine learning

OCI Data Science le oferă experților în date familiaritate și versatilitate, datorită sutelor de instrumente și frameworkuri open source populare, cum ar fi TensorFlow sau PyTorch, dar și posibilității de adăugare a altor frameworkuri. Datorită parteneriatului strategic dintre OCI și Anaconda, utilizatorii OCI pot să descarce și să instaleze gratuit pachete direct din depozitul Anaconda, astfel încât mediul open source securizat devine mai accesibil ca oricând.

Biblioteca Oracle Accelerated Data Science (ADS)

Oracle Accelerated Data Science SDK este un set de instrumente Python ușor de utilizat, care sprijină experții în date pe parcursul întregului lor flux de lucru.

Instruirea modelelor

Hardware puternic, inclusiv unități de procesare grafică (GPU)

Cu procesoarele grafice NVIDIA, experții în date pot crea și instrui modele de învățare structurată într-un timp mai scurt. În comparație cu unitățile CPU, performanța accelerării poate crește de 5 până la 10 ori.

Jobs

Utilizați Jobs pentru a rula seturi de sarcini de știință a datelor repetabile. Scalați resursele de instruire a modelelor cu suport pentru GPU bare metal NVIDIA și instruire distribuită.

Editare în consolă a artefactelor de joburi

Creați, editați și rulați cu ușurință artefacte de job Data Science direct din consola OCI, folosind editorul de coduri. Vine cu integrare Git, upgrade automat, personalizare și multe altele.

Organizarea și gestionarea modelelor

Catalog de modele

Experții în date utilizează catalogul de modele pentru a păstra și partaja modelele de machine learning finalizate. Catalogul stochează artefactele și captează metadatele despre taxonomie și contextul modelului, hiper-parametri, definițiile schemelor de date de intrare și rezultatele modelului și informații detaliate despre proveniența modelului, inclusiv codul sursă și mediul de instruire.

Evaluarea și compararea modelelor

Generați automat o suită complexă de parametri și vizualizări pentru a măsura performanța modelului în raport cu datele noi și a compara candidații la model.

Medii reproductibile

Utilizați mediile conda predefinite, organizate pentru a rezolva o varietate de cazuri de utilizare, cum ar fi NLP, viziunea computerizată, prognoza, analiza graficelor și Spark. Publicați medii personalizate și le partajați cu colegii, asigurând reproductibilitatea mediilor de instruire și inferență.

Cu control al versiunilor

Experții în date se pot conecta la depozitul Git al organizației lor pentru a păstra și prelua activitatea de machine learning.

Automatizare și MLOps

Implementarea modelului gestionat

Implementați modelele de machine learning ca puncte finale HTTP pentru deservirea predicțiilor de modele pentru datele noi în timp real. Pur și simplu, faceți clic pentru a implementa din catalogul de modele, iar OCI Data Science gestionează toate operațiunile de infrastructură, inclusiv alocarea computerelor și echilibrarea traficului.

Procese ML

Operaționalizați și automatizați fluxurile de lucru pentru crearea, instruirea și implementarea modelelor cu un serviciu gestionat complet, astfel încât să creați, să remediați erorile, să urmăriți, să gestionați și să executați fluxuri ML.

Monitorizare ML

Monitorizați continuu modelele din producție, pentru a detecta devierea de date și de concepte. Le permite experților în date, inginerilor de fiabilitate a site-urilor și inginerilor DevOps să primească alerte și să evalueze rapid necesitățile de reinstruire a modelului.

Aplicații ML

Proiectată inițial pentru aplicațiile SaaS proprii ale Oracle, pentru încorporarea caracteristicilor AI, aplicațiile ML sunt acum disponibile pentru automatizarea întregului ciclu de viață MLOps, inclusiv pentru dezvoltare, asigurarea accesului, mentenanță continuă și gestionarea flotei, pentru furnizori de servicii de internet cu sute de modele pentru fiecare dintre miile lor de clienți.