Once desafíos comunes de las startups de IA y cómo abordarlos

Jeffrey Erickson | Estratega de contenido | 12 de enero de 2024

Cuando OpenAI lanzó al público ChatGPT, su gran modelo de lenguaje (LLM), en noviembre de 2022, acumuló 100 millones de usuarios en solo dos meses. Eso convirtió fácilmente a ChatGPT en una de las aplicaciones de consumo de más rápido crecimiento de la historia.

Los inversores lo notaron.

Desde entonces, los miembros de la lista de las 50 principales empresas de IA de Forbes han recaudado colectivamente más de 27.200 millones de dólares. Algunas de esas empresas tienen menos de un año de edad con menos de 20 empleados. Para las startups de IA con ideas intrigantes, el efectivo fluye.

Sin embargo, el dinero recaudado no garantiza el éxito. Las startups de IA afrontan retos únicos que exigen algo más que la tenacidad, la sincronización con el mercado y la gestión del crecimiento habituales. Entrenar los LLM que alimentan servicios como ChatGPT o el generador de imágenes de IA de Midjourney es una de las tareas más intensivas desde el punto de vista computacional que ha concebido la humanidad. Las empresas de inversión afirman que la mayor parte del capital que recaudan las startups de IA se destina directamente a recursos informáticos.

Más allá de eso, las startups de IA son responsables de la seguridad y la privacidad de la información confidencial que acecha en las montañas de datos de entrenamiento que sus modelos ingieren, incluso mientras luchan por competir con los gigantes tradicionales que también se están moviendo rápidamente para capturar la cuota de mercado.

El fundador de Microsoft, Bill Gates, afirma que la IA es el avance más importante en materia de computación desde la interfaz gráfica de usuario, que lanzó el Macintosh de Apple y todos los sistemas operativos y aplicaciones populares desde entonces. Así que es comprensible que los empresarios quieran una parte de esta acción. Veamos los factores que las startups de IA deben tener en cuenta al entrar en liza.

¿Qué es una startup de IA?

Las startups de IA generativa vienen en tres tipos: las que desarrollan plataformas de LLM, como OpenAI o Cohere; las que ofrecen nuevas herramientas para crear y entrenar LLM, como MosaicML; y las que toman LLM de código abierto y los entrenan para resolver problemas empresariales específicos; un ejemplo es Tome, que aplica IA para mejorar las presentaciones empresariales.

Todas las startups de IA están trabajando en el resplandor de empresas como ChatGPT, Google y otras empresas que han utilizado poderosas arquitecturas informáticas llamadas redes neuronales y algoritmos de aprendizaje automático para construir interfaces de lenguaje natural amigables que puedan generar texto, contenido visual y código informático similares a los humanos y realizar muchas otras tareas.

Conclusiones clave

  • Aunque las plataformas de IA se utilizan desde hace muchos años, la popularización de los LLM para uso público en 2022 ha provocado una avalancha de nuevas empresas emergentes.
  • Los inversores están encontrando, investigando y financiando estas empresas emergentes a un ritmo vertiginoso.
  • Las startups de IA operan en un panorama cambiante de preocupaciones sobre la privacidad y la normativa, competencia por la capacidad informática y amenazas de los titulares.

Desafíos de las startups de IA

Desde tipos de problemas bien financiados hasta startups, estas últimas se enfrentan a obstáculos únicos para los proveedores de servicios basados en IA. Los 11 desafíos que se enumeran a continuación dan una buena idea de los posibles obstáculos que nos esperan.

1. Seguridad y privacidad

Las startups de IA asumen responsabilidades de seguridad y privacidad que van más allá de los esfuerzos estándar de protección de datos de las empresas. Muchas medidas de seguridad resultarán familiares, como el empleo de un modelo de confianza cero y la supervisión de redes para detectar actividades maliciosas que activen respuestas y alertas automatizadas. Pero también hay nuevos desafíos. Por ejemplo, los modelos de IA podrían filtrar detalles de los datos utilizados para entrenarlos. Estos conjuntos de datos pueden tener cientos de gigabytes, o incluso terabytes, de tamaño, extraídos de una variedad de fuentes. Pueden contener datos sensibles, como nombres, direcciones e información personal identificable. ¿Podría un modelo entrenado con estos datos reflejar detalles privados en sus resultados?

Es importante que una startup sepa qué datos hay en sus conjuntos de entrenamiento y tenga un plan para minimizar los riesgos que conlleva la información confidencial o regulada. Estas empresas tienen que convencer a los inversores de que tienen cubiertas estas preocupaciones y de que disponen de un plan de respuesta en materia de comunicaciones por si algo sale mal.

2. Volumen de datos

Las empresas de IA entrenan e implementan grandes modelos de lenguaje (LLM) con amplios conjuntos de datos y miles de millones de parámetros para todo tipo de casos de uso, como el procesamiento del lenguaje natural (NLP) y la creación de imágenes. También desarrollan modelos de IA para visión por computadora, previsión y predicción, detección de anomalías y mucho más. Los LLM, en particular, requieren volúmenes de datos increíblemente grandes para producir resultados precisos y coherentes.

Si eres una startup de IA, la gestión de datos es el núcleo de tu negocio.

Sin embargo, un desafío clave es encontrar los conjuntos de datos adecuados para tus necesidades de entrenamiento de IA y cargarlos en un almacén de datos masivo o un lakehouse de datos. Los datos deben fluir de forma segura a través de redes neuronales y algoritmos de aprendizaje automático utilizando superclusters de servidores de unidades de procesamiento gráfico (GPU), si es que puedes encontrarlos.

Chips grandes

Una GPU es un chip con muchos más núcleos que una unidad de procesamiento central (CPU). Este diseño, como se ve en CUDA de Nvidia, abreviatura de arquitectura de dispositivos unificados de cálculo, potencia el paralelismo masivo necesario para tareas como el entrenamiento de IA.

3. Capacidad informática

Una afirmación que vemos una y otra vez en los programas de televisión, las películas y los medios de comunicación populares es que la IA destruirá el mundo. Un contraargumento: "¿Dónde obtendrá la IA malvada las GPU?"

Para ejecutar las redes neuronales sobre las que se construyen los modelos de IA, las GPU dividen el trabajo computacional. A continuación, el sistema ejecuta consultas a través de un grupo de GPU en paralelo. Esto aligera la carga de la CPU del ordenador y permite a la red realizar cálculos complejos con gran rapidez. El entrenamiento y la ejecución de modelos de IA requieren tanta potencia informática que los fabricantes de chips y proveedores de nube del mundo tienen dificultades para mantenerse al día con la demanda. Ten en cuenta que puede que tengas que ponerte a la cola para comprar chips o convencer a un proveedor de la nube de que tu startup de IA es merecedora de esas preciadas GPU.

4. Personalización

Es seguro afirmar que la mayoría de las startups de IA construirán sus empresas en torno a un LLM desarrollado por otra empresa porque, en la mayoría de los casos, personalizar un modelo de IA de la talla de OpenAI o Cohere es más eficiente que diseñar, desarrollar y entrenar uno desde cero.

Hay dos enfoques comunes para personalizar un LLM para un sector o caso de uso en particular: ajuste fino y generación aumentada de recuperación (RAG). Puedes ajustar los resultados de un sistema de IA entrenándolo con grandes cantidades de datos específicos de tu causa y dándole instrucciones para que dé más peso a esa información en sus respuestas. La otra opción, la RAG, consiste en incrustar documentos muy relevantes en una base de datos que la IA utilizará para dar contexto a las indicaciones escritas o verbales que reciba. Con RAG, esos documentos permiten a la IA añadir detalles técnicos relevantes a sus resultados, e incluso citar de dónde obtuvo la información. Por ejemplo, una startup de atención médica podría incrustar documentos o artículos que ayuden a su LLM a comprender mejor la intención de las indicaciones de los profesionales médicos y luego proporcionar un lenguaje de salida relacionado con sus especializaciones.

Cada método tiene beneficios y desventajas en términos de agilidad, calidad y costo. El enfoque de la personalización del LLM es una decisión importante para cualquier startup de IA que espere ofrecer un servicio específico para un sector o un caso de uso.

5. Costos de la nube

Para las empresas en modo de inicio rápido, es difícil decir no a la infraestructura en la nube lista para usar. Todos los proveedores de nube a hiperescala ofrecen lo necesario para entrenar o personalizar grandes modelos de lenguaje, incluidos clusteres de instancias de cálculo conectados por una red de gran ancho de banda y un sistema de archivos de alto rendimiento. Y como estos servicios se basan en el consumo, a menudo son menos costosos, y normalmente mucho más rápidos, que crear una infraestructura in situ.

Debido a que estos sistemas se basan en el consumo, la velocidad y la eficiencia deben sopesarse con respecto al costo. Una startup de IA puede mantener bajo su gasto ejecutando un LLM que haga lo que tiene que hacer con los algoritmos menos complejos y los menores datos posibles. Una vez hecho ese cálculo presupuestario, elige una infraestructura en la nube que gestione tu modelo de forma eficiente. Por ejemplo, la ejecución en servidores bare metal evita la sobrecarga de las instancias virtualizadas y ofrece un mejor rendimiento. Esto se hace aún más significativo cuando se trata de cargas de trabajo agrupadas comunes a los LLM.

Recuerda, cuanto más rápido se ejecute tu trabajo, menos pagas.

6. Eficiencia

Puede tomar muchas horas de gigavatios de energía entrenar un LLM. Como referencia, un gigavatio podría suministrar energía a 874.000 hogares durante un año, según la empresa de inversiones The Carbon Collective. Una startup que busca fondos de capital riesgo para ofrecer servicios basados en LLM debe demostrar que está utilizando su dinero sabiamente. Por ejemplo, no todas las tareas de IA necesitan el mismo nivel de sofisticación del modelo o de potencia computacional. Una creciente colección de LLM de empresas como OpenAI, Cohere, Anthropic y otras ofrecen distintas variantes y tamaños. Prepárate para explicar por qué tu elección se ajusta a tus necesidades y a tu presupuesto.

Una vez que hayas elegido tu modelo y tus conjuntos de datos, selecciona cuidadosamente una infraestructura con procesamiento paralelo eficiente y escalado dinámico para evitar pagar por recursos informáticos que no utilizas. Prepárate para demostrar a los inversores que tus elecciones logran un equilibrio entre rendimiento y asequibilidad.

7. Ampliación

Hay tres técnicas principales para escalar los LLM con el fin de aumentar la calidad y/o la velocidad de los resultados del LLM: aumentar la cantidad de datos de entrenamiento, utilizar un modelo más grande y complejo, o añadir capacidad de cálculo.

Un modelo más grande aumenta el número de capas y parámetros en la arquitectura de la red neuronal, lo que le da una mayor capacidad para aprender y representar patrones complejos en los datos. Como resultado, su LLM dará respuestas más detalladas y matizadas. Al añadir más gigabytes de datos de entrenamiento, tu startup de IA puede ofrecer respuestas más precisas o completas. En ambos casos, también necesitarás aumentar los costosos recursos informáticos para mantener el rendimiento del modelo.

8. Calidad de datos

Este no es un desafío específico de la inteligencia artificial. Los analistas empresariales llevan décadas preocupándose por la calidad de los datos que utilizan. Las startups de IA necesitan aprovechar la experiencia de los científicos de datos y los expertos en la materia para eliminar la información redundante, el contenido irrelevante y otros "ruidos" de los conjuntos de datos utilizados para entrenar algoritmos y alimentar los LLM.

"Garbage in, garbage out" es un adagio que debería resonar con las startups de IA.

9. KPI y medición

Es importante que las startups de IA establezcan medidas cuantitativas y cualitativas para el éxito. Las medidas cuantitativas incluyen el retorno de la inversión en tecnología y los indicadores clave de rendimiento (KPI) técnicos, como el error cuadrático medio (MSE), que identifica los resultados atípicos.

Más allá de eso, una startup de IA debe ser capaz de medir resultados cualitativos, como el rendimiento de un modelo de IA en datos nuevos o no vistos anteriormente, los resultados relevantes para el público objetivo y los resultados integrales en el contexto del campo que se está discutiendo.

10. Financiación

Existen diversos enfoques para financiar una startup de IA. Se pueden seguir los ejemplo de LLMs como Midjourney y Surge AI, que han hecho crecer sus bases de clientes gradualmente sin tomar dinero de inversión. Si tu startup de IA no puede esperar al crecimiento inicial, hay inversores ángeles, aceleradoras e incubadoras que buscan fundadores de IA con mentes agudas y buenas ideas. El beneficio de las incubadoras y aceleradoras es que proporcionan relaciones, acceso a oportunidades de mercado, asesoramiento empresarial e incluso plataformas tecnológicas para crear un servicio de IA.

11. Ventas y marketing

Las plataformas de ventas y marketing de vanguardia emplean la IA en cada etapa del recorrido del cliente, y cualquier startup que busque aumentar su cuota de mercado querrá emplear la IA para ayudar. ¿Cómo? La IA puede utilizar datos detallados, incluidos datos de geolocalización en tiempo real para asignar y rastrear el movimiento, para crear ofertas de productos o servicios personalizadas para clientes potenciales. Los asistentes de inteligencia artificial pueden generar oportunidades de venta cruzada y de ventas adicionales, o incentivar a los compradores a completar las transacciones una vez que los artículos están en sus carritos. Está demostrado que estas tácticas aumentan las tasas de conversión y complacen a los inversores deseosos de que una startup aumente sus ventas.

Tras la venta, los servicios habilitados por la IA pueden gestionar las consultas, comprendiendo el contexto y ofreciendo sugerencias, al tiempo que comparten detalles concretos sobre la programación o los plazos de entrega y dirigen las preguntas más complejas a agentes humanos. Ver cómo funcionan estos servicios respaldados por IA puede ayudarte a comparar las ofertas de tu propia startup de IA.

Amplía tu negocio con Oracle

Si estás creando un negocio basado en IA, considera Oracle Cloud Infrastructure (OCI), que proporciona una infraestructura sólida para entrenar y servir modelos a escala. A través de su asociación con NVIDIA, Oracle puede proporcionar a sus clientes superclusters impulsados por las últimas GPU y conectados con una red RDMA sobre Ethernet convergente (RoCE) de latencia ultrabaja. Esta arquitectura proporciona un método rentable y de alto rendimiento para entrenar modelos generativos de IA a escala. Muchas startups de IA, incluidas Adept y MosaicML, están creando sus productos directamente en OCI.

Oracle facilita la introducción a los servicios de OCI, incluidos algunos servicios en la nube siempre gratuitos. Las startups pueden aprender con sandboxes para desarrolladores o implementaciones empaquetadas de software popular, como la implementación de un cluster de Kubernetes.

Para ayudar a las startups a decidir, Oracle proporciona herramientas exploratorias, como calculadoras de costos, reseñas de analistas de terceros y comparaciones detalladas entre OCI y otras plataformas en la nube.

La inteligencia artificial lleva más de una década en nuestras vidas, trabajando en segundo plano, controlando el fraude en millones de transacciones bancarias, interviniendo en las interacciones de atención al cliente en primera línea y tomando decisiones rápidas para acelerar la logística de los envíos nocturnos. Ahora, con la última generación de LLM, las sutiles, poderosas y asombrosas capacidades de la IA obtienen la interfaz de usuario que merecen: la palabra natural hablada o escrita.

Como resultado, los LLM han cautivado la imaginación popular con la creación de imágenes, texto escrito y traducción, e incluso generación de código. Aunque abundan los desafíos, ahora es el momento de que las startups de IA encuentren inversores, atiendan a nuevos clientes y escalen como si estuviéramos en 1999.

Establecer un centro de excelencia de IA antes de que comience el entrenamiento específico de la organización aumenta las probabilidades de éxito. Nuestro ebook explica por qué y ofrece consejos para crear un centro de excelencia eficaz.

Preguntas frecuentes sobre IA y startups

¿Cuáles son los desafíos comunes para las startups de IA?

Las startups de IA se enfrentan a desafíos a la hora de elegir el LLM adecuado para entrenar, encontrar los datos de entrenamiento adecuados y reunir la inmensa potencia informática necesaria para respaldar sus redes neuronales. También hay que enfrentarse a cuestiones de privacidad y seguridad de los datos, y a normativas cambiantes.

¿Qué tipos de servicios ofrecen las startups de IA?

Las startups de IA están apareciendo en todos los sectores empresariales, incluidos aquellos tan variados como la atención médica, la fabricación y la defensa nacional. Algunas startups están ofreciendo productos a los consumidores, mientras que otras están desarrollando herramientas utilizadas por otras empresas de IA para construir y entrenar sus modelos.

¿Cómo encuentran financiación las startups de IA?

Las startups que buscan inversores pueden hacer una búsqueda rápida de inversores ángeles, que están al acecho de oportunidades. Otras opciones son las incubadoras o aceleradoras tecnológicas, que pueden proporcionar orientación y asistencia tecnológica a los fundadores de startups.