Experții în date pot accesa și utiliza orice sursă de date, în orice cloud sau on-premises. Astfel, sunt disponibile mai multe date potențiale, care conduc la modele mai bune.
Oracle Cloud Infrastructure (OCI) Data Labeling este un serviciu de creare a unor seturi de date etichetate, pentru instruirea mai precisă a modelelor AI și machine learning. Prin OCI Data Labeling, dezvoltatorii și experții în date colectează date, creează și parcurg seturi de date și aplică etichete înregistrărilor de date.
Trimiteți interogări Spark interactive către clusterul OCI Data Flow Spark. Sau utilizați Oracle Accelerated Data Science SDK pentru a dezvolta cu ușurință o aplicație Spark și a o rula apoi la scară, pe OCI Data Flow, totul din mediul Data Science.
Stabiliți fluxurile de proiectare a caracteristicilor și generați caracteristici cu execuție gestionată complet. Creați versiuni și documente atât pentru caracteristici, cât și pentru fluxurile de caracteristici. Partajați, organizați și controlați accesul la caracteristici. Consumați caracteristici pentru scenarii de inferență atât în set, cât și în timp real.
Mediile JupyterLab, de tip notebook, integrate și găzduite în cloud, le permit echipelor de experți în date să creeze și să instruiască modele folosind o interfață cu utilizatorul foarte familiară.
OCI Data Science le oferă experților în date familiaritate și versatilitate, datorită sutelor de instrumente și frameworkuri open source populare, cum ar fi TensorFlow sau PyTorch, dar și posibilității de adăugare a altor frameworkuri. Datorită parteneriatului strategic dintre OCI și Anaconda, utilizatorii OCI pot să descarce și să instaleze gratuit pachete direct din depozitul Anaconda, astfel încât mediul open source securizat devine mai accesibil ca oricând.
Oracle Accelerated Data Science SDK este un set de instrumente Python ușor de utilizat, care sprijină experții în date pe parcursul întregului lor flux de lucru.
Cu procesoarele grafice NVIDIA, experții în date pot crea și instrui modele de învățare structurată într-un timp mai scurt. În comparație cu unitățile CPU, performanța accelerării poate crește de 5 până la 10 ori.
Utilizați Jobs pentru a rula seturi de sarcini de știință a datelor repetabile. Scalați resursele de instruire a modelelor cu suport pentru GPU bare metal NVIDIA și instruire distribuită.
Creați, editați și rulați cu ușurință artefacte de job Data Science direct din consola OCI, folosind editorul de coduri. Vine cu integrare Git, upgrade automat, personalizare și multe altele.
Experții în date utilizează catalogul de modele pentru a păstra și partaja modelele de machine learning finalizate. Catalogul stochează artefactele și captează metadatele despre taxonomie și contextul modelului, hiper-parametri, definițiile schemelor de date de intrare și rezultatele modelului și informații detaliate despre proveniența modelului, inclusiv codul sursă și mediul de instruire.
Generați automat o suită complexă de parametri și vizualizări pentru a măsura performanța modelului în raport cu datele noi și a compara candidații la model.
Utilizați mediile conda predefinite, organizate pentru a rezolva o varietate de cazuri de utilizare, cum ar fi NLP, viziunea computerizată, prognoza, analiza graficelor și Spark. Publicați medii personalizate și le partajați cu colegii, asigurând reproductibilitatea mediilor de instruire și inferență.
Experții în date se pot conecta la depozitul Git al organizației lor pentru a păstra și prelua activitatea de machine learning.
Implementați modelele de machine learning ca puncte finale HTTP pentru deservirea predicțiilor de modele pentru datele noi în timp real. Pur și simplu, faceți clic pentru a implementa din catalogul de modele, iar OCI Data Science gestionează toate operațiunile de infrastructură, inclusiv alocarea computerelor și echilibrarea traficului.
Operaționalizați și automatizați fluxurile de lucru pentru crearea, instruirea și implementarea modelelor cu un serviciu gestionat complet, astfel încât să creați, să remediați erorile, să urmăriți, să gestionați și să executați fluxuri ML.
Monitorizați continuu modelele din producție, pentru a detecta devierea de date și de concepte. Le permite experților în date, inginerilor de fiabilitate a site-urilor și inginerilor DevOps să primească alerte și să evalueze rapid necesitățile de reinstruire a modelului.
Proiectată inițial pentru aplicațiile SaaS proprii ale Oracle, pentru încorporarea caracteristicilor AI, aplicațiile ML sunt acum disponibile pentru automatizarea întregului ciclu de viață MLOps, inclusiv pentru dezvoltare, asigurarea accesului, mentenanță continuă și gestionarea flotei, pentru furnizori de servicii de internet cu sute de modele pentru fiecare dintre miile lor de clienți.