O que é IA generativa? Como funciona?

Greg Pavlik | Vice-Presidente Sênior, Oracle Cloud Infrastructure | 15 de setembro de 2023

o-que-e-ia-generativa

A inteligência artificial generativa é uma forma relativamente nova de IA que, ao contrário das suas antecessoras, pode criar novos conteúdos ao extrapolar os seus dados de treino. Sua capacidade extraordinária de produzir escrita, imagens, áudio e vídeo semelhantes aos humanos capturou a imaginação do mundo desde que o primeiro chatbot de IA generativa foi lançado ao público no segundo semestre de 2022. Um relatório de junho de 2023 da McKinsey & Company estimou que a IA generativa tem o potencial de adicionar anualmente entre 6,1 e 7,9 bilhões de dólares à economia global, aumentando a produtividade dos trabalhadores. Para colocar isso em contexto, a mesma pesquisa estima o potencial econômico anual de aumento da produtividade de todas as tecnologias de IA entre 17,1 e 25,6 bilhões de dólares. Portanto, embora a IA generativa esteja em alta em meados de 2023, ela ainda é apenas uma parte do "todo” da IA.

Mas toda ação tem uma reação igual e oposta. Assim, juntamente com as suas notáveis perspectivas de produtividade, a IA generativa traz novos potenciais riscos empresariais – tais como imprecisão, violações de privacidade e exposição à propriedade intelectual – bem como a capacidade de disrupção econômica e social em grande escala. Por exemplo, é pouco provável que os benefícios de produtividade da IA generativa sejam alcançados sem esforços substanciais de reciclagem dos trabalhadores e, mesmo assim, irão, sem dúvida, deslocar muitos dos seus empregos atuais. Consequentemente, legisladores em todo o mundo, e até mesmo alguns executivos da indústria tecnológica, já estão demandando a rápida adoção de regulamentos sobre IA.

Este artigo é uma exploração aprofundada da promessa e do risco da IA generativa: como funciona; suas aplicações, casos de uso e exemplos mais imediatos; suas limitações; seus potenciais benefícios e riscos comerciais; melhores práticas para usá-la; e um vislumbre de seu futuro.

O que é Inteligência artificial generativa?

IA generativa (Generative AI ou GAI) é o nome dado a um subconjunto de tecnologias de machine learning de IA que desenvolveram recentemente a capacidade de criar conteúdo rapidamente em resposta a solicitações via texto, que podem variar de curtas e simples a muito longas e complexas. Diferentes ferramentas de IA generativa podem produzir novos conteúdos de áudio, imagem e vídeo, mas foi a IA conversacional orientada por texto que despertou a imaginação dos desenvolvedores. Na verdade, as pessoas podem conversar e aprender com modelos de IA generativa treinados em texto, praticamente da mesma forma que fazem com os humanos.

A IA generativa conquistou o mundo nos meses após o lançamento do ChatGPT, um chatbot baseado no modelo de rede neural GPT-3.5 da OpenAI, em 30 de novembro de 2022. GPT significa Generative Pretrained Transformer (transformador pré-treinado generativo, em português), palavras que descrevem principalmente a arquitetura de rede neural subjacente do modelo.

Há muitos casos anteriores de chatbots de conversação, começando com o ELIZA do Massachusetts Institute of Technology, lançado em meados da década de 1960. Mas a maioria dos chatbots anteriores, incluindo o ELIZA, eram total ou amplamente baseados em regras, por isso não tinham compreensão contextual. Suas respostas eram limitadas a um conjunto de regras e modelos predefinidos. Em contraste, os modelos de IA generativa atuais não possuem tais regras ou modelos predefinidos. Metaforicamente, eles são cérebros primitivos e vazios (redes neurais) que são expostos ao mundo por meio de treinamento em dados do mundo real. Eles então desenvolvem de forma independente a inteligência – um modelo representativo de como esse mundo funciona –, que usam para gerar novos conteúdos em resposta a prompts. Até mesmo os especialistas em IA não sabem exatamente como fazem isso, pois os algoritmos são autodesenvolvidos e ajustados à medida que o sistema é treinado.

Grandes e pequenas empresas devem estar entusiasmadas com o potencial da IA generativa para aproveitar os benefícios da automação tecnológica para o trabalho intelectual, que até agora tem resistido, em grande parte, à automação. As ferramentas de IA generativa mudam o cálculo da automação do trabalho intelectual; sua capacidade de produzir escrita, imagens, áudio ou vídeo semelhantes aos humanos em resposta a prompts de texto significa que essa inteligência podem colaborar com parceiros humanos para gerar conteúdo que represente trabalho prático.

“Nos próximos anos, muitas empresas treinarão seus próprios modelos especializados de linguagem grande”, disse Larry Ellison, presidente e diretor de tecnologia da Oracle, durante a teleconferência de resultados de junho de 2023 da empresa.

IA generativa VS IA

A Inteligência Artificial é uma vasta área da ciência da computação, da qual a IA generativa é uma pequena parte, pelo menos atualmente. Naturalmente, a IA generativa partilha muitos atributos em comum com a IA tradicional. Mas também existem algumas distinções marcantes.

  • Atributos comuns: Ambas dependem de grandes quantidades de dados para treinamento e tomada de decisões (embora a quantidade de dados de treinamento para IA generativa possa ser muito maior). As duas aprendem padrões a partir dos dados e usam esse “conhecimento” para fazer previsões e adaptar o seu próprio comportamento. Alternativamente, ambas podem ser melhoradas ao longo do tempo, ajustando os seus parâmetros com base no feedback ou em novas informações.
  • Diferenças: Os sistemas tradicionais de IA geralmente são projetados para executar uma tarefa específica melhor ou com menor custo do que um ser humano, como detectar fraudes de cartão de crédito, determinar instruções de direção ou – provavelmente em breve – dirigir um carro. A IA generativa é mais ampla; ela cria conteúdo novo e original que se assemelha, mas não pode ser encontrado, em seus dados de treinamento. Além disso, os sistemas tradicionais de IA, como os de machine learning, são treinados principalmente em dados específicos para a função pretendida, enquanto os modelos de IA generativa são treinados em conjuntos de dados grandes e diversos (e então, às vezes, ajustados em volumes de dados muito menores vinculados a uma função específica). Por fim, a IA tradicional é quase sempre treinada em dados rotulados/categorizados usando técnicas de aprendizagem supervisionada, enquanto a IA generativa deve sempre ser treinada, pelo menos inicialmente, usando aprendizagem não supervisionada (em que os dados não são rotulados e o software de IA não recebe orientação explícita).

Outra diferença digna de nota é que o treino de modelos fundamentais para IA generativa é “extremamente caro”, para citar um pesquisador de IA. Digamos, US$ 100 milhões são necessários apenas para o hardware inicial, bem como os custos equivalentes de serviços de nuvem, já que é onde a maior parte do desenvolvimento de IA é feita. Depois, há o custo dos enormes volumes de dados necessários.

Principais conclusões

  • A IA generativa virou uma sensação viral a partir de novembro de 2022 e espera-se que em breve acrescente trilhões de dólares à economia global todos os anos.
  • IA é uma forma de machine learning com base em rede neural, treinado em vastos conjuntos de dados que podem criar novos conteúdos de texto, imagem, vídeo ou áudio em resposta a prompts de linguagem natural dos usuários.
  • Os pesquisadores do mercado preveem que a tecnologia proporcionará um impulso econômico ao acelerar significativamente o crescimento da produtividade dos trabalhadores intelectuais, cujas tarefas têm resistido à automação até agora.
  • A IA generativa apresenta riscos e limitações que as empresas devem procurar reduzir, como o fornecimento de informações incorretas ou falsas e a violação inadvertida de direitos autorais.
  • Prevê-se também que provoque mudanças significativas na natureza do trabalho, incluindo possíveis perdas de postos de trabalho e reestruturação de funções.

Inteligência artificial generativa explicada

Para empresas de todos os tamanhos, a promessa aparentemente mágica da IA generativa é que ela pode trazer os benefícios da automação tecnológica para o trabalho de natureza intelectual. Ou, como afirma um relatório da McKinsey, “atividades que envolvem tomada de decisões e colaboração, que anteriormente tinham o menor potencial de automação”.

Historicamente, a tecnologia tem sido mais eficaz na automatização de tarefas rotineiras ou repetitivas para as quais as decisões já eram conhecidas ou podiam ser determinadas com um nível elevado de confiança com base em regras específicas e bem compreendidas. Pense em manufatura, com a sua repetição precisa da linha de montagem, ou em contabilidade, com os seus princípios regulamentados definidos pelas associações industriais. Mas a IA generativa tem potencial para realizar um trabalho cognitivo muito mais sofisticado. Para sugerir um exemplo mais extrapolado, a IA generativa pode ajudar na formação da estratégia de uma organização, respondendo a promts que solicitem ideias e cenários alternativos para os gestores de uma empresa durante alguma intercorrência no setor.

Em seu relatório, a McKinsey avaliou 63 casos de uso em 16 funções de negócios, concluindo que 75% dos trilhões de dólares de valor potencial que poderiam ser obtidos com a IA generativa virão de um subconjunto de casos de uso em apenas quatro dessas funções: operações de clientes , marketing e vendas, engenharia de software e pesquisa e desenvolvimento. As perspectivas de aumento de receita entre os setores foram distribuídas de forma mais uniforme, embora houvesse destaques: a alta tecnologia liderou a lista em termos de possível aumento como porcentagem das receitas do setor, seguida de bancos, produtos farmacêuticos e médicos, educação, telecomunicações e saúde.

Por outro lado, uma análise do Gartner correlacionou-se com as previsões da McKinsey: por exemplo, que mais de 30% dos novos medicamentos e materiais serão descobertos usando técnicas de IA generativa até 2025, acima do zero que temos hoje, e que 30% das comunicações de marketing de grandes organizações serão, da mesma forma, geradas sinteticamente em 2025, acima dos 2% em 2022. Em uma pesquisa online, o Gartner descobriu que a experiência e a retenção do cliente foi a principal resposta (38%) de 2.500 executivos quando questionados sobre em quais áreas gostariam de investir no uso de IA generativa.

O que torna tudo isso possível tão rapidamente é que, ao contrário da IA tradicional, que tem automatizado silenciosamente e acrescentado valor aos processos comerciais durante décadas, a IA generativa explodiu na consciência do mundo graças ao talento conversacional do ChatGPT. Isso também esclareceu e atraiu as pessoas para a tecnologia de IA generativa que se concentra em outras modalidades; todos parecem estar experimentando escrever textos ou compor músicas, imagens e vídeos usando um ou mais dos vários modelos especializados em cada área. Assim, com muitas organizações já se aventurando na IA generativa, o seu impacto nos negócios e na sociedade será provavelmente colossal – e acontecerá incrivelmente rápido.

A desvantagem óbvia é que o trabalho intelectual mudará. As funções individuais mudarão - significativamente - e os trabalhadores precisarão aprender novas habilidades. Alguns empregos serão extintos. Historicamente, porém, as grandes mudanças tecnológicas, como a IA generativa, sempre acrescentaram mais empregos (e de maior valor) à economia do que eliminaram. Mas isso não traz muito conforto para aqueles cujos empregos se tornarão obsoletos.

Como a IA generativa funciona?

Há duas respostas para a questão de como funcionam os modelos de IA generativa. Empiricamente, sabemos com detalhes como eles funcionam porque as pessoas projetaram suas diversas implementações de redes neurais para fazer exatamente o que fazem, iterando esses projetos ao longo de décadas para torná-los cada vez melhores. Os desenvolvedores de IA sabem exatamente como os neurônios estão conectados; eles projetaram o processo de treinamento de cada modelo. No entanto, na prática, ninguém sabe exatamente como os modelos de IA generativa fazem o que fazem – essa é a verdade embaraçosa.

“Não sabemos como eles realizam a tarefa criativa porque o que acontece dentro das camadas da rede neural é complexo demais para ser decifrado, pelo menos hoje”, disse Dean Thompson, ex-diretor de tecnologia de várias startups de IA que foram adquiridas ao longo dos anos por empresas, incluindo LinkedIn e Yelp, onde permanece como engenheiro de software sênior trabalhando em modelos de linguagem grandes (LLMs). A capacidade da IA generativa de produzir novos conteúdos originais parece ser uma propriedade emergente do que é conhecido, ou seja, da sua estrutura e treinamento. Portanto, embora haja muito para explicar em relação ao que sabemos, o que um modelo como o GPT-3.5 está realmente fazendo internamente – o que está pensando, por assim dizer – ainda não foi descoberto. Alguns pesquisadores estão confiantes de que isso se tornará conhecido nos próximos 5 a 10 anos; outros não têm certeza de que algum dia será totalmente compreendido.

Aqui está uma versão geral do que sabemos sobre o funcionamento da IA generativa:

  • Começa com o cérebro Um bom lugar para começar a compreender os modelos de IA generativa é o cérebro humano, disse Jeff Hawkins em seu livro de 2004, “On Intelligence”. Hawkins, cientista da computação, neurocientista e empresário, apresentou seu trabalho em uma sessão de 2005 no PC Forum, que foi uma conferência anual dos principais executivos de tecnologia liderada pela investidora em tecnologia Esther Dyson. Hawkins levantou a hipótese de que, ao nível dos neurônios, o cérebro funciona prevendo continuamente o que vai acontecer a seguir e depois aprendendo com as diferenças entre as suas previsões e a realidade subsequente. Para melhorar a sua capacidade preditiva, o cérebro constrói uma representação interna do mundo. Em sua teoria, a inteligência humana emerge desse processo. Seja por influência de Hawkins ou não, a IA generativa funciona exatamente dessa forma. E, surpreendentemente, age como se fosse inteligente.

  • Construa uma rede neural artificial. Todos os modelos de IA generativa começam com uma rede neural artificial codificada em software. Thompson disse que uma boa metáfora visual para uma rede neural é imaginar uma planilha, mas em três dimensões, porque os neurônios artificiais são empilhados em camadas, semelhante à forma como os neurônios reais são empilhados no cérebro. Os pesquisadores da área até chamam cada neurónio de “célula”, observou Thompson, e cada uma contém uma fórmula que o relaciona com outras células na rede, imitando a forma como as ligações entre os neurónios cerebrais têm forças diferentes.

    Cada camada pode ter dezenas, centenas ou milhares de neurônios artificiais, mas o número de células não é o foco dos pesquisadores de IA. Em vez disso, eles medem os modelos pelo número de conexões entre neurônios. A força dessas conexões varia com base nos coeficientes de suas equações celulares, que são mais comumente chamados de “pesos” ou “parâmetros”. Esses coeficientes de definição de conexão são a que se refere quando você lê, por exemplo, que o modelo GPT-3 tem 175 bilhões de parâmetros. Há rumores de que a versão mais recente, GPT-4, tem trilhões de parâmetros, embora isso não tenha sido confirmado. Existem várias arquiteturas de redes neurais com características diferentes que se prestam à produção de conteúdo em uma modalidade específica; a arquitetura do transformador parece ser melhor para modelos de linguagem grandes, por exemplo.

  • Ensine o modelo de rede neural do recém-nascido. Modelos de linguagem grandes recebem enormes volumes de texto para processar e são encarregados de fazer previsões simples, como a próxima palavra em uma sequência ou a ordem correta de um conjunto de frases. Na prática, porém, os modelos de redes neurais funcionam em unidades chamadas tokens, não palavras.

    “Uma palavra comum pode ter seu próprio token, as incomuns certamente seriam compostas de vários tokens, e alguns deles podem ser apenas um único espaço seguido por ‘th’ porque essa sequência de três caracteres é muito comum”, disse Thompson. Para fazer cada previsão, o modelo insere um token na camada inferior de uma pilha específica de neurônios artificiais; essa camada o processa e passa sua saída para a próxima camada e assim por diante até que a saída final emerge do topo da pilha. Os tamanhos das pilhas podem variar significativamente, mas geralmente são da ordem de dezenas de camadas, não de milhares ou milhões.

    Nos estágios iniciais do treinamento, as previsões do modelo não são muito boas. Mas cada vez que o modelo prevê um token, ele verifica a exatidão dos dados de treinamento. Quer esteja certo ou errado, um algoritmo de “retropropagação” ajusta os parâmetros – ou seja, os coeficientes das fórmulas – em cada célula da pilha que fez aquela previsão. O objetivo dos ajustes é tornar a previsão correta mais provável.

    “Isso também acontece com respostas corretas, porque essa previsão certa pode ter tido apenas, digamos, 30% de certeza, mas esses 30% eram o máximo de todas as outras respostas possíveis”, disse Thompson. “Então, a retropropagação busca transformar esses 30% em 30,001%, ou algo parecido.”

    Depois que o modelo repetiu esse processo para trilhões de tokens de texto, ele se tornou muito bom em prever o próximo token ou palavra. Após o treinamento inicial, os modelos de IA generativa podem ser ajustados por meio de uma técnica de aprendizagem supervisionada, como a aprendizagem por reforço a partir de feedback humano (Reinforced Learning from Human Feedback, RLHF). Na RLHF, o resultado do modelo é fornecido a revisores humanos que fazem uma avaliação binária positiva ou negativa – polegar para cima ou para baixo – que é reinserida no modelo. A RLHF foi usada para ajustar o modelo GPT 3.5 da OpenAI para ajudar a criar o chatbot ChatGPT que se tornou viral.

  • Mas como o modelo respondeu à minha pergunta? É um mistério. Veja como Thompson explica o estado atual de entendimento: “Há um enorme ‘simplesmente não sabemos’ no meio da minha explicação. O que sabemos é que toda a sua pergunta é considerada uma sequência de tokens e, na primeira camada, tudo isso é processado simultaneamente. E sabemos que o modelo processa as saídas daquela primeira camada na próxima camada e assim por diante na pilha. E então temos noção de que ele usa essa camada superior para prever, ou seja, produzir um primeiro token, e este é representado como um dado em todo o sistema para produzir o próximo token, e assim sucessivamente.

    “A próxima questão lógica é: o que e como o modelo pensou em meio a esse processo? O que todas essas camadas fizeram? E a resposta definitiva é: não sabemos. Nós... não... sabemos. Você pode estudá-lo. Você pode observá-lo. Mas a complexidade vai além da nossa capacidade de análise. É como F-MRI [ressonância magnética funcional] no cérebro das pessoas. É o exemplo mais grosseiro do que o modelo realmente fez. Não sabemos".

    Embora seja controverso, um grupo de mais de uma dúzia de pesquisadores que teve acesso antecipado ao GPT-4 em 2022 concluiu que a inteligência com a qual o modelo responde aos desafios complexos que lhe são colocados, e a ampla gama de conhecimentos que exibe, indica que o GPT-4 atingiu uma forma de inteligência geral. Em outras palavras, construiu um modelo interno de como o mundo funciona, tal como o cérebro humano faria, e utiliza esse modelo para raciocinar através das questões que lhe são apresentadas. Um dos pesquisadores disse ao podcast “This American Life” que teve um momento surpreendente quando pediu ao GPT-4: “Dê-me uma receita de biscoito com gotas de chocolate, mas escrita no estilo de uma pessoa muito deprimida ”, e o modelo respondeu: “Ingredientes: 1 xícara de manteiga amolecida, se você conseguir encontrar energia para amolecê-la. 1 colher de chá de extrato de baunilha, o falso sabor artificial da felicidade. 1 xícara de gotas de chocolate meio amargo, pequenas alegrias que acabarão por derreter.

Por que essa tecnologia é importante?

Uma maneira útil de compreender a importância da IA generativa é pensar nela como uma calculadora para conteúdo criativo e aberto. Assim como uma calculadora automatiza a matemática rotineira, liberando uma pessoa para se concentrar em tarefas mais sofisticadas, a IA generativa tem o potencial de automatizar as subtarefas mais corriqueiras que constituem grande parte do trabalho de conhecimento, permitindo que as pessoas atuem em trabalhos mais valiosos.

Considere os desafios que os profissionais de marketing enfrentam para obter insights acionáveis a partir dos dados não estruturados, inconsistentes e desconectados. Tradicionalmente, eles precisariam consolidar esses dados como uma primeira etapa, o que requer bastante engenharia de software personalizada para fornecer uma estrutura comum a fontes de dados díspares, como mídias sociais, notícias e feedback de clientes.

“Mas com os LLMs, você pode simplesmente inserir informações de diferentes fontes diretamente no prompt e, em seguida, solicitar insights relevantes, ou qual feedback priorizar, ou requerer análise de sentimento e terá bons resultados”, disse Basim Baig, gerente sênior de engenharia especializado em IA e segurança na Duolingo. “O poder do LLM é que ele permite pular aquela enorme e cara etapa de engenharia.”

Pensando mais além, Thompson sugere que os profissionais de marketing de produtos podem usar os LLMs para marcar textos de formato livre para análise. Por exemplo, imagine que você tem um enorme banco de dados de menções ao seu produto nas redes sociais. Você pode desenvolver um software que aplica um LLM e outras tecnologias para:

  • Extrair os temas principais de cada postagem nas redes sociais.
  • Agrupar os temas idiossincráticos que surgem de postagens individuais em temas recorrentes.
  • Identificar quais postagens apoiam cada tema recorrente.

Você pode aplicar os resultados para:

  • Estudar os temas recorrentes mais frequentes, clicando nos exemplos.
  • Acompanhar o aumento e a queda de temas recorrentes.
  • Pedir a um LLM para se aprofundar em um tema para menções recorrentes às características do produto.

Quais são os modelos de IA Generativa?

A IA generativa representa uma ampla categoria de aplicações baseadas em um conjunto cada vez mais rico de variações de redes neurais. Embora toda IA generativa se enquadre na descrição geral contida na seção Como a IA Generativa Funciona, as técnicas de implementação variam para suportar diferentes mídias, como imagens versus texto, e para incorporar avanços das pesquisas e da indústria à medida que surgem.

Os modelos de redes neurais usam padrões repetitivos de neurônios artificiais e suas interconexões. Um projeto de rede neural – para qualquer aplicação, incluindo IA generativa – geralmente repete o mesmo padrão de neurônios centenas ou milhares de vezes, reutilizando os mesmos parâmetros. Essa é uma parte essencial do que é chamado de “arquitetura de rede neural”. A descoberta de novas arquiteturas tem sido uma área importante de inovação em IA desde a década de 1980, muitas vezes impulsionada pelo objetivo de dar suporte a um novo meio. Mas depois, uma vez inventada uma nova arquitetura, muitas vezes ocorrem progressos adicionais através da sua utilização de formas inesperadas. A inovação adicional vem da combinação de elementos de diferentes arquiteturas.

Duas das arquiteturas mais antigas e ainda mais comuns são:

  • As redes neurais recorrentes (Recurrent Neural Networks, NNS) surgiram em meados da década de 1980 e continuam em uso. As RNNs demonstraram como a IA poderia aprender – e ser usada para automatizar tarefas que dependem de – dados sequenciais, ou seja, informações cuja sequência contém significado, como linguagem, comportamento do mercado de ações e fluxos de cliques na web. As RNNs estão no centro de muitos modelos de IA de áudio, como aplicações de geração de música; pense na natureza sequencial da música e na dependência do tempo. Mas elas também são bons em processamento de linguagem natural (PLN). As RNNs também são usadas em funções tradicionais de IA, como reconhecimento de fala, análise de caligrafia, previsão financeira e meteorológica, e para antecipar variações na demanda de energia, entre muitas outras aplicações.
  • As redes neurais convolucionais (Convoluted Neural Networks, CNNs) surgiram cerca de 10 anos depois. Elas se concentram em dados semelhantes a grades e, portanto, são ótimas em representações de dados espaciais e podem gerar imagens. Aplicações populares de IA generativa de texto para imagem, como Midjourney e DALL-E, usam CNNs para gerar a imagem final.

Embora as CNNs ainda sejam usadas com frequência, esforços sucessivos para melhorá-las levaram a um avanço:

  • Os modelos de transformadores evoluíram para uma forma muito mais flexível e poderosa de representar sequências do que as CNNs. Eles possuem diversas características que lhes permitem processar dados sequenciais, como texto, de forma massivamente paralela, sem perder a compreensão das sequências. Esse processamento paralelo de dados sequenciais está entre as principais características que tornam o ChatGPT capaz de responder tão rápido e bem a prompts de conversação simples.

As pesquisas, o setor privado e os esforços de código aberto criaram modelos impactantes que inovam em níveis mais elevados de arquitetura e aplicação de redes neurais. Por exemplo, houve inovações cruciais no processo de treinamento, na forma como o feedback é incorporado para melhorar o modelo e na maneira com que múltiplos modelos podem ser combinados em aplicações de IA generativa. Aqui está um resumo de algumas das inovações mais importantes do modelo de IA generativa:

  • Autoencodificadores variacionais (Variational Autoencoders, VAEs) usam inovações na arquitetura de redes neurais e nos processos de treinamento e são frequentemente incorporados em aplicações de geração de imagens. Eles consistem em redes codificadoras e decodificadoras, cada uma das quais pode usar uma arquitetura subjacente diferente, como RNN, CNN ou transformador. O codificador aprende as características importantes de uma imagem, compacta essas informações e as armazena como uma representação na memória. O decodificador então usa essas informações compactadas para tentar recriar o original. Por fim, o VAE aprende a gerar novas imagens semelhantes aos seus dados de treinamento.
  • Redes generativas adversárias (Generative Adversarial Networks, GANs) são usadas em diversas modalidades, mas parecem ter uma afinidade especial com vídeo e outras aplicações relacionadas a imagens. O que diferencia as GANs de outros modelos é que elas consistem em duas redes neurais que competem entre si durante o treinamento. No caso das imagens, por exemplo, o “gerador” cria uma imagem e o “discriminador” decide se a imagem é real ou gerada. O gerador está constantemente tentando enganar o discriminador, que está sempre tentando pegar o gerador em flagrante. Na maioria dos casos, as duas redes neurais concorrentes são baseadas em arquiteturas CNN, mas também podem ser variantes de RNNs ou transformadores.
  • Os modelos de difusão incorporam múltiplas redes neurais em uma estrutura geral, às vezes integrando diferentes arquiteturas, como CNNs, transformadores e VAEs. Os modelos de difusão aprendem ao compactar dados, adicionar e remover ruídos e tentar regenerar o original. A popular ferramenta Stable Diffusion usa um codificador e decodificador VAE para a primeira e a última etapa, respectivamente, e duas variações de CNN nas etapas de adição/remoção de ruído.

Pra que serve a IA generativa?

Embora o mundo tenha apenas começado a arranhar a superfície dos usos potenciais da IA generativa, é fácil ver como as empresas podem se beneficiar ao aplicá-la em suas operações. Considere como a IA generativa pode mudar as principais áreas de interações com clientes, vendas e marketing, engenharia de software e pesquisa e desenvolvimento.

No atendimento ao cliente, a tecnologia anterior de IA automatizou processos e introduziu o autoatendimento, mas também causou novas frustrações aos clientes. A IA generativa promete trazer benefícios tanto para os clientes quanto para os agentes de atendimento, com chatbots que podem ser adaptados a diferentes idiomas e regiões, criando uma experiência mais personalizada e acessível. Quando a intervenção humana é necessária para resolver um problema do cliente, os agentes de atendimento podem colaborar com ferramentas de IA generativa em tempo real para encontrar estratégias viáveis, melhorando a velocidade e a precisão das interações. A velocidade com que a IA generativa pode explorar toda a base de conhecimento de uma grande empresa e sintetizar novas soluções para reclamações de clientes dá à equipe de serviço uma maior capacidade de resolver problemas específicos com eficácia, em vez de depender de ramais telefônicos desatualizados e transferências de chamadas até que uma resposta seja encontrada —ou o cliente fique sem paciência.

No marketing, a IA generativa pode automatizar a integração e a análise de dados de fontes díspares, o que deverá acelerar drasticamente o tempo de obtenção de insights e levar diretamente a uma tomada de decisão mais bem informada e ao desenvolvimento mais rápido de estratégias de entrada no mercado. Os profissionais de marketing podem usar essas informações junto com outros insights gerados por IA para criar campanhas publicitárias novas e mais direcionadas. Isso reduz o tempo que a equipe gasta coletando dados demográficos e de comportamento de compra e lhes dá mais oportunidades para analisar resultados e debater novas ideias.

Tom Stein, presidente e diretor de marca da Stein IAS, diz que todas as agências de marketing, incluindo a sua, estão explorando essas oportunidades em alta velocidade. Mas, observa Stein, também existem ganhos mais simples e rápidos para os processos de back-end de uma agência.

“Se recebermos uma RFI (solicitação de informações), normalmente, 70% a 80% da RFI buscará as mesmas informações que qualquer outra, talvez com algumas diferenças contextuais específicas para a situação daquela empresa”, disse Stein, que foi também presidente do júri do 2023 Cannes Lions Creative B2B Awards. “Não é díficil nos colocarmos em uma posição em que qualquer uma das ferramentas de IA faça esse trabalho para nós... Então, se recuperarmos 80% desse tempo e pudermos empregá-lo para agregar valor à RFI, é uma vitória em todos os sentidos. E há uma série de processos como esse.”

Os desenvolvedores de software que colaboram com IA generativa podem agilizar e acelerar processos em todas as etapas, desde o planejamento até a manutenção. Durante a fase inicial de criação, as ferramentas de IA generativa podem analisar e organizar grandes quantidades de dados e sugerir múltiplas configurações de programas. Depois que a codificação começa, a IA pode testar e solucionar problemas de código, identificar erros, executar diagnósticos e sugerir correções – tanto antes quanto depois do lançamento. Thompson observa que, como muitos projetos de software corporativo incorporam múltiplas linguagens e disciplinas de programação, ele e outros engenheiros de software usaram a IA para se educarem em áreas desconhecidas com muito mais rapidez do que antes. Ele também usou ferramentas de IA generativa para explicar códigos desconhecidos e identificar problemas específicos.

Em P&D, a IA generativa pode aumentar a velocidade e a profundidade das pesquisas de mercado durante as fases iniciais do design do produto. Assim, os programas de IA, especialmente aqueles com capacidade de gerar imagens, podem criar designs detalhados de produtos potenciais antes de os simular e testar, dando aos trabalhadores as ferramentas de que necessitam para fazer ajustes rápidos e eficazes ao longo do ciclo de P&D.

O fundador da Oracle, Ellison, destacou na teleconferência de resultados de junho que “os LLMs especializados irão acelerar a descoberta de novos medicamentos que salvam vidas”. A descoberta de medicamentos é uma aplicação de P&D que explora a tendência dos modelos generativos de extrapolar informações incorretas ou não verificáveis, mas no bom sentido: identificando novas moléculas e sequências de proteínas em apoio à busca de novos tratamentos de saúde. Em outra iniciativa, a subsidiária da Oracle Cerner Enviza se uniu à Food and Drug Administration (FDA) dos EUA e ao John Snow Labs para aplicar ferramentas de IA ao desafio de “compreender os efeitos dos medicamentos sobre grandes populações.” A estratégia de IA da Oracle é tornar a inteligência artificial difundida em suas aplicações e infraestrutura de nuvem.

Casos de uso da IA generativa

A IA generativa tem um potencial de longo alcance para acelerar ou automatizar totalmente um conjunto diversificado de tarefas. As empresas devem planejar formas deliberadas e específicas de maximizar os benefícios que isso pode trazer para as suas operações. Aqui estão alguns casos de uso específicos:

  • Preencher lacunas de conhecimento: Com suas interfaces de usuário simples e baseadas em bate-papo, as ferramentas de IA generativa podem responder a perguntas gerais ou específicas dos funcionários para orientá-los na direção certa quando encontram algum obstáculo, de consultas simples a operações complexas. Os vendedores, por exemplo, podem solicitar insights sobre uma conta específica; desenvolvedores podem aprender novas linguagens de programação.
  • Verificar se há erros: As ferramentas de IA generativa podem pesquisar erros em qualquer texto, desde emails informais até amostras de redação profissional. E elas podem fazer mais do que corrigir erros: são capazes de explicar o quê e o porquê para ajudar os usuários a aprender e melhorar seu trabalho.
  • Melhorar a comunicação: As ferramentas de IA generativa podem traduzir texto em diferentes idiomas, ajustar o tom, criar mensagens exclusivas com base em diferentes conjuntos de dados e muito mais. As equipes de marketing podem usar ferramentas de IA generativa para criar campanhas publicitárias mais relevantes, enquanto a equipe interna pode usá-las para pesquisar comunicações anteriores e encontrar rapidamente informações relevantes e respostas a perguntas, sem recorrer a outros funcionários. Thompson acredita que essa capacidade de sintetizar o conhecimento institucional sobre qualquer questão ou ideia que um colaborador possa ter alterará fundamentalmente a forma como as pessoas se comunicam dentro de grandes organizações, impulsionando a geração de conhecimento.
  • Facilitar a carga administrativa: Empresas com trabalho administrativo pesado, como codificação/faturamento médico, podem usar IA generativa para automatizar tarefas complexas, incluindo o arquivamento adequado de documentos e a análise de anotações médicas. Isso libera a equipe para se concentrar em um trabalho mais prático, como atendimento ao paciente ou ao cliente.
  • Verificar imagens médicas em busca de anormalidades: Os profissionais da saúde podem usar IA generativa para digitalizar prontuários e exames de imagem para sinalizar problemas e dar aos médicos recomendações sobre medicamentos, incluindo possíveis efeitos colaterais contextualizados com o histórico do paciente.
  • Solucionar problemas de código: Os engenheiros de software podem usar modelos de IA generativa para solucionar problemas e ajustar seus códigos de maneira mais rápida e confiável do que vasculhar linha por linha. Eles podem então solicitar explicações mais profundas à ferramenta para informar a codificação futura e melhorar seus processos.

Quais são os benefícios?

Os benefícios que a IA generativa pode trazer para uma empresa derivam principalmente de três atributos abrangentes: síntese do conhecimento, colaboração humano-IA e velocidade. Embora muitos dos benefícios mencionados abaixo sejam semelhantes aos prometidos no passado por modelos anteriores de IA e ferramentas de automação, a presença de um ou mais desses três atributos pode ajudar as empresas a perceber as vantagens de forma mais rápida, fácil e eficaz.

Com a IA generativa, as organizações podem construir modelos personalizados treinados no seu próprio conhecimento institucional e propriedade intelectual, após os quais os trabalhadores podem pedir ao software para colaborar em uma tarefa na mesma linguagem que utilizariam com um colega. Esse modelo especializado de IA generativa pode responder sintetizando informações de toda a base de conhecimento corporativa com uma velocidade surpreendente. Essa abordagem não só reduz ou elimina a necessidade de conhecimentos complexos – e muitas vezes pouco eficazes e caros – em engenharia de software para criar programas específicos para tais tarefas, como também é provável que surjam ideias e conexões que as abordagens anteriores não conseguiam proporcionar.

  • Maior produtividade: Os trabalhadores intelectuais podem usar IA generativa para reduzir o tempo gasto em tarefas rotineiras do dia a dia, como aprender sobre uma nova disciplina repentinamente necessária para um projeto futuro, organizar ou categorizar dados, vasculhar a Internet em busca de pesquisas aplicáveis ou redigir emails. Ao utilizar a IA generativa, menos funcionários podem realizar tarefas que antes exigiam grandes equipes ou horas de trabalho em uma fração do tempo. Uma equipe de programadores, por exemplo, poderia passar horas examinando códigos incorretos para descobrir o que deu errado, mas uma ferramenta de IA generativa pode ser capaz de encontrar os erros em instantes e relatá-los junto com sugestões de correções. Como alguns modelos de IA generativa possuem competências que são aproximadamente médias ou melhores em um amplo espectro de habilidades, a colaboração com um sistema de IA generativa pode aumentar drasticamente a produtividade do seu parceiro humano. Por exemplo, um gerente de produto júnior também pode ser pelo menos um gestor de projeto médio com o auxílio de uma IA. Todos esses recursos acelerariam drasticamente a capacidade dos trabalhadores do conhecimento de concluir um projeto.

  • Custos reduzidos: Devido à sua velocidade, as ferramentas de IA generativa reduzem os custos para concluir processos e, se levar metade do tempo para realizar uma tarefa, a tarefa custará metade do que custaria de outra forma. Além disso, a IA generativa pode minimizar erros, eliminar o tempo de inatividade e identificar redundâncias e outras ineficiências. No entanto, há uma contrapartida: devido à tendência da IA generativa de extrapolar, a supervisão humana e o controle de qualidade ainda são necessários. Mas espera-se que as colaborações entre humanos e IA realizem muito mais trabalho em menos tempo do que se desempenhado apenas por pessoas – e melhor e com mais precisão do que as ferramentas de IA sozinhas –, reduzindo assim os custos. Ao testar novos produtos, por exemplo, a IA generativa pode ajudar a criar simulações mais avançadas e detalhadas do que as ferramentas mais antigas. Em última análise, isso reduz o tempo e o custo de teste de novos produtos.

  • Maior satisfação do cliente: Os clientes podem obter uma experiência superior e mais personalizada por meio de autoatendimento e ferramentas de IA generativa que “sussurram no ouvido” dos representantes de atendimento, providenciando informações em tempo real. Embora os chatbots de atendimento ao cliente com tecnologia de IA encontrados hoje possam às vezes parecer frustrantemente limitados, é fácil imaginar uma experiência do cliente de qualidade muito superior, alimentada por um modelo de IA generativa especialmente treinado, com base no calibre das conversas do ChatGPT atuais.

  • Tomada de decisões mais bem informada: Modelos de IA generativa específicos de empresas, especialmente treinados, podem fornecer insights detalhados por meio de modelagem de cenários, avaliação de riscos e outras abordagens sofisticadas para análise preditiva. Os tomadores de decisão podem aproveitar essas ferramentas para obter uma compreensão mais profunda do setor e da posição da empresa nele através de recomendações personalizadas e estratégias acionáveis, informadas por dados de maior alcance e análises mais rápidas do que os analistas humanos ou a tecnologia mais antiga poderiam gerar por si próprios.

    Por exemplo, os decisores podem planejar melhor a alocação de estoque antes de uma temporada movimentada através de previsões de demanda mais precisas, possibilitadas por uma combinação de dados internos recolhidos pelo sistema de planeamento de recursos empresariais (ERP) e uma pesquisa de mercado externa abrangente, que é então analisada por um modelo de IA generativa especializado. Neste caso, melhores decisões de alocação minimizam compras excessivas e faltas de estoque, ao mesmo tempo que maximizam as vendas potenciais.

  • Lançamentos de produtos mais rápidos: A IA generativa pode produzir rapidamente protótipos de produtos e primeiros rascunhos, ajudar a ajustar trabalhos em andamento e testar/solucionar problemas de projetos existentes para encontrar melhorias muito mais rápido do que era possível anteriormente.

  • Controle de qualidade: Um modelo de IA generativa especializado e específico de uma empresa provavelmente irá expor lacunas e inconsistências nos manuais do usuário, vídeos e outros conteúdos que uma empresa apresenta ao público.

Uma amostra de benefícios específicos da IA generativa
  Síntese do conhecimento Colaboração humano-IA Velocidade
Produtividade aumentada Organize dados, agilize pesquisas e primeiras iterações de produtos. Eduque os trabalhadores sobre novas disciplinas, sugira novas formas de resolver problemas. Acelere a capacidade dos trabalhadores de concluir um novo projeto.
Custos reduzidos Identifique redundâncias e ineficiências para melhorar os fluxos de trabalho. Minimize os erros humanos e reduza o tempo de inatividade através da supervisão colaborativa. Conclua tarefas mais rapidamente (se uma tarefa levar metade do tempo, terá metade do custo).
Satisfação do cliente aprimorada Organize e recupere rapidamente informações de contas de clientes para acelerar a resolução de problemas. Chatbots aprimorados para automatizar interações simples e fornecer melhores informações aos agentes quando a ajuda humana for necessária. Forneça atualizações e informações da conta em tempo real aos clientes e agentes de atendimento.
Tomada de decisão mais informada Acelere os insights ao mediar análises preditivas, como modelagem de cenários e avaliação de riscos. Forneça recomendações personalizadas e estratégias viáveis aos tomadores de decisão. Gere análises mais rápidas a partir de dados de maior alcance do que analistas humanos ou tecnologias mais antigas.
Lançamentos de produtos mais rápidos Produza protótipos e “produtos minimamente viáveis” (Minimal Viable Product, MVP). Teste e solucione problemas de projetos existentes para encontrar melhorias. Aumente a velocidade com que os ajustes podem ser implementados.

Quais são as limitações da Inteligência Artificial generativa?

Qualquer pessoa que tenha usado ferramentas de IA generativa para educação e/ou pesquisa provavelmente já experimentou sua limitação mais conhecida: elas inventam coisas. Como o modelo está apenas prevendo a próxima palavra, ele pode extrapolar a partir de seus dados de treinamento para declarar falsidades com tanta autoridade quanto as verdades que relata. Essa extrapolação é o que os pesquisadores chamam de "alucinação", e é uma das principais razões pelas quais a atual variedade de ferramentas de IA generativa requer colaboradores humanos. As empresas devem ter o cuidado de preparar e gerir esta e outras limitações à medida que implementam a IA generativa. Se uma empresa estabelecer expectativas irrealistas ou não gerir eficazmente a tecnologia, as consequências podem prejudicar seu desempenho e reputação.

  • Requer supervisão: Os modelos de IA generativa podem introduzir informações falsas ou enganosas, muitas vezes com tantos detalhes e tom autoritário que até mesmo os especialistas podem ser enganados. Da mesma forma, seus resultados podem conter linguagem tendenciosa ou ofensiva aprendida no conjunto de dados em que o modelo foi treinado. Os seres humanos continuam sendo uma parte crítica do fluxo de trabalho para evitar que esses resultados falhos se espalhem e cheguem aos clientes ou influenciem a política da empresa.
  • Poder computacional e investimento inicial: Os modelos de IA generativa exigem enormes quantidades de poder computacional para treinamento e operação. Muitas empresas não possuem os recursos e o conhecimento necessários para construir e manter esses sistemas por conta própria. Essa é uma das razões pelas quais grande parte do desenvolvimento de IA generativa é feito usando infraestrutura em nuvem.
  • Potencial para convergir, não para divergir: As organizações que não constroem os seus próprios modelos especializados, confiando em vez disso em ferramentas públicas de IA generativa, podem estar condenadas à mediocridade. Muitas vezes, elas descobrirão que suas conclusões são idênticas às de outros porque se baseiam nos mesmos dados de treinamento. A menos que essas empresas incorporem inovação humana no seu trabalho, poderão até se adaptar às boas práticas atuais, mas terão dificuldade em encontrar um diferencial competitivo.
  • Resistência da equipe e dos clientes: A equipe, especialmente os funcionários mais antigos com protocolos e métodos arraigados, pode ter dificuldade para se ajustar à IA generativa, levando a uma diminuição na produtividade enquanto se adaptam. Da mesma forma, os funcionários podem resistir à tecnologia por medo de perder os seus empregos. Os gestores e líderes empresariais devem atenuar esses receios e ser abertos e transparentes sobre como a tecnologia irá mudar – ou não – a estrutura dos negócios.

Quais são os riscos?

A IA generativa provocou reações extremas em ambos os lados do espectro de risco. Alguns grupos estão preocupados que isso leve à extinção humana, enquanto outros insistem que salvará o mundo. Esses extremos estão fora do escopo deste artigo. No entanto, aqui estão alguns riscos e preocupações importantes que os líderes empresariais que implementam a tecnologia de IA devem compreender para que possam tomar medidas para evitar quaisquer potenciais consequências negativas.

  • Confiança e confiabilidade: Modelos de IA generativa fazem afirmações imprecisas, às vezes extrapolando informações completamente fabricadas. Da mesma forma, muitos modelos são treinados com dados mais antigos, normalmente analisando apenas informações publicadas até uma determinada data, mas o que se adequa ao mercado do ano passado pode já não ser relevante ou útil. Por exemplo, as empresas que procuram melhorar as suas operações na cadeia de suprimentos podem descobrir que as sugestões dos seus modelos estão desatualizadas e não são relevantes na economia global em constante mudança. Os usuários devem verificar todas as reivindicações antes de agir sobre elas para garantir precisão e relevância.

  • Privacidade/propriedade intelectual: Os modelos de IA generativa muitas vezes continuam a aprender com as informações fornecidas como parte dos prompts. As empresas, especialmente aquelas que recolhem informações pessoais sensíveis dos seus clientes, tais como consultórios médicos, devem tomar cuidado para não expor IPs protegido ou dados confidenciais. Se o modelo acessar essas informações, poderá aumentar a probabilidade de exposição.

  • Engenharia social turbinada: Os autores de ameaças já estão usando IA generativa para ajudá-los a personalizar melhor a engenharia social e outros ataques cibernéticos, fazendo com que pareçam mais autênticos.

    “Já é muito difícil distinguir se você está falando com um bot ou uma pessoa online”, disse Baig, engenheiro de segurança e IA da Duolingo. “Tornou-se muito mais fácil para os criminosos que querem ganhar dinheiro gerar um monte de conteúdo que pode enganar as pessoas.”

  • Diminuição na qualidade e na originalidade dos resultados: A IA generativa pode tornar a criação de produtos e conteúdos mais fácil e rápida, mas não garante um resultado de maior qualidade. Depender de modelos de IA sem colaboração humana significativa pode resultar em produtos padronizados que carecem de criatividade.

  • Viés: Se um modelo de IA generativa for treinado com base em dados tendenciosos, que vão desde lacunas nas perspectivas até conteúdo prejudicial e danoso, esses preconceitos serão refletidos em seus resultados. Por exemplo, se uma empresa contratou historicamente apenas um tipo de funcionário, o modelo pode cruzar a referência de novos candidatos com a contratação “ideal” e eliminar candidatos qualificados porque não se enquadram no padrão, mesmo que a organização pretendesse descartar esse referencial.

  • Shadow AI: O uso de IA generativa pelos funcionários sem a sanção ou conhecimento oficial da organização pode levar uma empresa a divulgar inadvertidamente informações incorretas ou a violar os direitos autorais de outra organização.

  • Colapso do modelo: Pesquisadores de IA identificaram um fenômeno chamado 'colapso do modelo' que pode tornar os modelos de IA generativa menos úteis ao longo do tempo. Essencialmente, à medida que o conteúdo gerado pela IA prolifera, os modelos treinados com base nesses dados sintéticos – que inevitavelmente contêm erros – acabarão por “esquecer” as características dos dados gerados por humanos nos quais foram originalmente treinados. Essa questão pode atingir um ponto de ruptura à medida que a Internet se torna mais povoada por conteúdo de IA, criando um ciclo de feedback que degrada o modelo.

  • Regulamentação de IA: Como a IA generativa é tão nova, não há muita regulamentação aplicável. Ainda assim, governos de todo o mundo estão procurando maneiras de regular essa situação. Alguns países, como a China, já propuseram medidas regulamentares sobre como os modelos podem ser treinados e o que podem produzir. À medida que mais países impõem regulamentações, as empresas, especialmente as internacionais, precisam monitorar leis novas para garantir a conformidade e evitar multas ou acusações criminais por utilização indevida da tecnologia.

Ética e IA generativa

A ascensão da análise de big data, há mais de uma década, levantou novas questões e debates éticos porque as ferramentas emergentes tornaram possível inferir informações privadas ou sensíveis sobre pessoas que elas não tinham, e não queriam, revelar. Como as empresas devem lidar com a capacidade de possuir essas informações?

Dado o seu potencial para turbinar a análise de dados, a IA generativa está suscitando novas questões éticas e fazendo ressurgir questões mais antigas.

  • Como a IA generativa impactará os trabalhadores? A IA generativa já está fazendo com que muitos trabalhadores se sintam desconfortáveis quanto às suas perspetivas de emprego a longo prazo – e com razão. Embora a história mostre que os avanços tecnológicos sempre geraram mais empregos e de maior valor do que eliminaram, as funções que a IA pode tornar obsoletas são as que hoje pagam as contas das pessoas.
  • Como podemos eliminar possíveis vieses? Sabemos que todos os modelos de IA têm potencial para produzir resultados tendenciosos. As organizações devem escolher proativamente como gerir esse desafio tanto do ponto de vista do risco empresarial como da perspectiva ética.
  • Como os malfeitores podem usar modelos GAI para causar danos ao público? Infelizmente, as inúmeras utilizações potenciais da IA generativa incluem atos criminosos e prejudiciais, especialmente à medida que os modelos se tornam mais acessíveis ao público. Vídeos de deepfake usando a voz e a imagem de alguém, ferramentas de hacking para aprimorar ataques cibernéticos, desinformação generalizada e campanhas de engenharia social são apenas algumas das maneiras pelas quais pessoas mal-intencionadas podem colocar a IA generativa em uso. Atualmente, muitos modelos possuem proteções, mas elas não são consideradas perfeitas. As empresas que implementam os seus próprios modelos devem compreender do que os seus sistemas são capazes e tomar medidas para garantir a sua utilização responsável.
  • A quem pertence o trabalho gerado por IA? Mesmo que uma empresa ajuste um modelo com base nos seus próprios dados, os modelos de IA generativa são treinados em grandes quantidades de dados externos. Os resultados apresentados podem incluir elementos do trabalho de outras organizações, levando a potenciais questões éticas e legais, como plágio e violação de direitos autorais. Isto é especialmente verdadeiro para modelos de IA que geram imagens; artistas de todos os campos criativos estão explorando maneiras de evitar que seus trabalhos sejam inseridos nesses programas. Os organismos reguladores podem criar novas regras ao longo do tempo, de modo que qualquer pessoa que utilize IA generativa deva considerar a origem do conteúdo e como ele será utilizado antes de publicá-lo como seu.

Exemplos de IA generativa

Empresas de todos os tamanhos e setores, desde as forças armadas dos Estados Unidos até a Coca-Cola, estão conduzindo experências com a IA generativa. Aqui está um pequeno conjunto de exemplos que demonstram o amplo potencial e a rápida adoção da tecnologia.

A Snap Inc., empresa por trás do Snapchat, lançou um chatbot chamado “My AI”, alimentado por uma versão da tecnologia GPT da OpenAI. Personalizado para se adequar ao tom e ao estilo do Snapchat, o My AI é programado para ser amigável e pessoal. Os usuários podem personalizar sua aparência com avatares, papéis de parede e nomes e usá-lo para conversar individualmente ou entre várias pessoas, simulando a maneira típica como os usuários do Snapchat se comunicam com seus amigos. Os usuários podem solicitar conselhos pessoais ou participar de conversas casuais sobre assuntos como comida, hobbies ou música – o bot pode até contar piadas. O Snapchat orienta o My AI para ajudar os usuários a explorar recursos da aplicação, como lentes de realidade aumentada, e para ajudá-los a obter informações para as quais normalmente não recorreriam ao Snapchat, como recomendar lugares para visitar em um mapa local.

A Bloomberg anunciou o BloombergGPT, um chatbot treinado aproximadamente metade em dados gerais sobre o mundo e a outra metade em dados proprietários da Bloomberg ou dados financeiros limpos. Ele pode realizar tarefas simples, como escrever boas manchetes de artigos, e truques de propriedade, como transformar prompts em inglês simples na linguagem de consulta da Bloomberg exigida pelos terminais de dados da empresa, que são essenciais em muitas organizações do setor financeiro.

A Oracle fez parceria com o desenvolvedor de IA Cohere para ajudar as empresas a construir modelos internos ajustados com dados corporativos privados, em um movimento que visa difundir o uso de ferramentas especializadas de IA generativa específicas da empresa.

“A Cohere e a Oracle estão trabalhando juntas para tornar muito, muito fácil para os clientes corporativos treinarem seus próprios modelos linguagens especializados, ao mesmo tempo que protegem a privacidade de seus dados de treinamento”, disse Ellison, da Oracle, a analistas financeiros durante a teleconferência de resultados de junho de 2023. A Oracle planeja incorporar serviços de IA generativa em plataformas de negócios para aumentar a produtividade e a eficiência em todos os processos existentes de uma empresa, evitando a necessidade de muitas companhias desenvolverem e treinarem seus próprios modelos desde o início. Para isso, a Oracle também anunciou recentemente a incorporação de capacidades de IA generativa em seu software de recursos humanos, o Oracle Fusion Cloud Human Capital Management (HCM).

Além disso:

  • A Coca-Cola está usando geradores de texto e imagem para personalizar o texto dos anúncios e criar experiências altamente personalizadas para os clientes.
  • A American Express, que há muito tempo está na vanguarda do uso de IA na detecção de fraudes de cartão de crédito, tem sua subsidiária Amex Digital Labs desenvolvendo recursos B2B e para consumidores.
  • O gabinete digital e de IA do Pentágono está experimentando cinco modelos de IA generativa, alimentando-os com dados confidenciais e testando-os para explorar como podem ser usados para sugerir opções criativas que os líderes militares nunca consideraram.
  • A Duolingo está usando um bot com tecnologia do ChatGPT para ajudar seus alunos de línguas estrangeiras. Ele fornece explicações detalhadas sobre por que suas respostas em testes práticos estão certas ou erradas, imitando a maneira como os usuários podem interagir com um tutor humano.
  • O Slack lançou um chatbot que visa ajudar os funcionários dos clientes a extrair insights e conselhos do corpus de conhecimento institucional que reside nos canais do Slack de cada cliente.

Ferramentas de IA generativa

ChatGPT é a ferramenta que se tornou uma sensação viral, mas uma infinidade de ferramentas de IA generativa estão disponíveis para cada modalidade. Por exemplo, apenas para escrever existem Jasper, Lex, AI-Writer, Writer e muitos outros. Para geração de imagens, Midjourney, Stable Diffusion e Dall-E parecem ser os mais populares atualmente.

Entre as dezenas de geradores de música estão AIVA, Soundful, Boomy, Amper, Dadabots e MuseNet. Embora se saiba que programadores de software colaboram com o ChatGPT, também existem muitas ferramentas especializadas de geração de código, incluindo Codex, codeStarter, Tabnine, PolyCoder, Cogram e CodeT5.

História da IA generativa

Talvez surpreendentemente, o primeiro passo no caminho para os modelos de IA generativa em uso hoje ocorreu em 1943, o mesmo ano em que o primeiro computador elétrico programável – o Colossus, que foi então usado pela Grã-Bretanha para decodificar mensagens criptografadas durante a Segunda Guerra Mundial – foi demonstrado. A etapa da IA foi um artigo de pesquisa, “Um cálculo lógico de ideias imanentes na atividade nervosa”, de Warren McCulloch, psiquiatra e professor da Faculdade de Medicina da Universidade de Illinois, e Walter Pitts, um neurocientista computacional autodidata.

Pitts, um aparente prodígio da matemática, fugiu de casa aos 15 anos e era morador de rua quando conheceu McCulloch, que levou Pitts para morar com sua família. O único diploma de Pitts foi um Bacharelado em Artes concedido pela Universidade de Chicago depois de publicar o artigo seminal que estabeleceu a matemática básica pela qual um neurônio artificial “decide” se deve produzir '1' ou '0'.

A segunda etapa se dá na área Buffalo, NY, com um psicólogo pesquisador do Laboratório Aeronáutico da Universidade de Cornell chamado Frank Rosenblatt. Atuando com uma bolsa concedida em julho de 1957 pelo Escritório de Pesquisa Naval do Departamento da Marinha dos Estados Unidos como parte do Projeto PARA (Perceiveing and Recognizing Automaton) da Universidade de Cornell, Rosenblatt baseou-se na matemática de McCulloch e Pitts para desenvolver o Perceptron, uma rede neural com uma única camada “oculta” entre as camadas de entrada e saída. Antes de construir o Mark I Perceptron, que hoje fica no Smithsonian Institution, Rosenblatt e a Marinha o simularam em um computador mainframe IBM 704 para uma demonstração pública em julho de 1958. Mas o Perceptron era uma rede neural tão simples que atraiu críticas do cientista da computação do Instituto de Tecnologia de Massachusetts, Marvin Minsky, cofundador do laboratório de IA do MIT. Minsky e Rosenblatt supostamente debateram as perspectivas de longo prazo do Perceptron em fóruns públicos, resultando no abandono da pesquisa de redes neurais pela comunidade de IA entre os anos 1960 e 1980.

O período ficou conhecido como “inverno da IA”.

O cenário para a pesquisa em redes neurais descongelou na década de 1980 graças às contribuições de vários pesquisadores, principalmente Paul Werbos, cujo trabalho inicial redescobriu o Perceptron, Geoffrey Hinton, Yoshua Bengio e Yann LeCun. Seus trabalhos combinados demonstraram a viabilidade de grandes redes neurais multicamadas e mostraram como tais redes poderiam aprender com suas respostas certas e erradas por meio da atribuição de créditos através de um algoritmo de retropropagação. Foi quando surgiram as RNNs e CNNs. Mas as limitações dessas primeiras redes neurais, combinadas com expectativas iniciais exageradas que não puderam ser satisfeitas devido a essas limitações e ao estado do poder computacional no momento, levaram a um segundo inverno de IA na década de 1990 e no início da década de 2000.

Dessa vez, porém, muitos pesquisadores de redes neurais mantiveram o curso, incluindo Hinton, Bengio e LeCun. O trio, às vezes chamado de “os padrinhos da IA”, compartilhou o Prêmio Turing de 2018 por seu trabalho na década de 1980, sua perseverança subsequente e suas contribuições contínuas. Em meados da década de 2010, novas e diversas variantes de redes neurais estavam emergindo rapidamente, conforme descrito na seção Modelos de IA Generativa.

O futuro da IA generativa

Ainda não se sabe qual o impacto que a IA generativa tem nas empresas e como as pessoas trabalham. Mas isto é claro: investimentos maciços estão sendo canalizados na IA generativa em múltiplas dimensões do esforço humano. Investidores de venture capital, empresas estabelecidas e praticamente todas as demais categorias estão investindo em startups de IA generativa a uma velocidade vertiginosa. A “mágica” universal dos LLMs é uma capacidade incrível de mediar a interação humana com big data, de ajudar as pessoas a dar sentido às informações, explicando-as de forma simples, clara e surpreendentemente rápida. Isso sugere que a IA generativa será incorporada a uma infinidade de aplicações existentes e causará a invenção de uma segunda onda de novas aplicações.

O Gartner, por exemplo, prevê que 40% das aplicações corporativas terão IA de conversação incorporada até 2024, 30% das empresas terão estratégias de desenvolvimento e teste impulsionadas por IA até 2025 e mais de 100 milhões de trabalhadores colaborarão com “colegas robóticos” até 2026.

Claro, é possível que os riscos e as limitações da IA generativa inviabilizem esse "rolo compressor". Ajustar modelos generativos para aprender as nuances do que torna um negócio único pode revelar-se difícil demais, executar tais modelos computacionalmente intensivos pode muito caro e uma exposição inadvertida de segredos comerciais pode afastar as empresas.

Ou tudo pode acontecer, mas a um ritmo mais lento do que muitos esperam agora. Como lembrete, a promessa da Internet acabou se concretizando. Mas demorou mais uma década do que a primeira geração de entusiastas previa, durante a qual foram construídas ou inventadas as infraestruturas necessárias e as pessoas adaptaram o seu comportamento às possibilidades do novo meio. Em muitos aspectos, a IA generativa é outro novo meio.

Os influenciadores estão pensando amplamente sobre o futuro da IA generativa nos negócios.

“Isso pode significar que construiremos empresas de forma diferente no futuro”, disse Sean Ammirati, que trabalha com venture capital e também é professor de empreendedorismo na Tepper School of Business da Universidade Carnegie Mellon e cofundador do Corporate Startup Lab da CMU. Da mesma forma que as empresas “nativas digitais” tiveram uma vantagem após a ascensão da Internet, Ammirati prevê que as futuras organizações construídas a partir do zero com base na automação alimentada por IA generativa serão capazes de assumir a liderança.

“Essas empresas priorizarão a automação, para que não tenham que reaprender como parar de fazer manualmente as coisas que deveriam fazer de forma automatizada”, disse ele. “Você pode acabar com um tipo de empresa muito diferente.”

Adote facilmente a IA Generativa com a Oracle

A Oracle não só tem um longo histórico de trabalho com recursos de inteligência artificial e os incorpora em seus produtos, como também está na vanguarda do desenvolvimento e das atividades de IA generativa. A Oracle Cloud Infrastructure é usada pelas principais empresas de IA generativa. Essa nuvem de última geração pode fornecer a plataforma perfeita para as empresas criarem e implementarem modelos de IA generativa especializados, específicos para suas organizações e linhas de negócios individuais. Conforme explicado por Ellison, da Oracle, “Todos os data centers em nuvem da Oracle têm uma rede RDMA [acesso remoto direto à memória] de alta largura de banda e baixa latência que é perfeitamente otimizada para construir clusters de GPU em grande escala que são usados para treinar modelos de liguagem grande. O alto desempenho extremo e a economia de custos relacionada à execução de cargas de trabalho de IA generativa em nossa nuvem Gen 2 tornaram a Oracle a escolha número um entre as empresas de desenvolvimento de IA de ponta.”

A parceria da Oracle com a Cohere levou a um novo conjunto de ofertas de serviços de nuvem de IA generativa. “Esse novo serviço protege a privacidade dos dados de treinamento dos nossos clientes corporativos, permitindo que eles usem com segurança seus próprios dados privados para treinar seus modelos de liguagem grandes", disse Ellison.

A história da IA generativa começou há 80 anos com a matemática de um adolescente fugitivo e se tornou uma sensação viral no final do ano passado com o lançamento do ChatGPT. A inovação nessa área está acelerando rapidamente, à medida que empresas de todas as dimensões e setores experimentam e investem nos seus recursos. Mas juntamente com a sua capacidade de melhorar significativamente o trabalho e a vida, a IA generativa traz grandes riscos, que vão desde a perda de empregos até, se acreditarmos nos pessimistas, o potencial de extinção humana. O que sabemos com certeza é que o gênio saiu da lâmpada – e não vai voltar.

O que torna a Oracle mais adequada para a IA generativa?

A Oracle oferece uma plataforma de dados moderna e infraestrutura de IA de baixo custo e alto desempenho. Fatores adicionais, como modelos poderosos e de alto desempenho, segurança de dados incomparável e serviços de IA integrados, demonstram por que a oferta de IA da Oracle é verdadeiramente desenvolvida para empresas.

Perguntas frequentes sobre IA generativa

O que é tecnologia de IA generativa?

A tecnologia de IA generativa é construída em arquiteturas de software de redes neurais que imitam a maneira como se acredita que o cérebro humano funciona. Essas redes neurais são treinadas inserindo grandes quantidades de dados em amostras relativamente pequenas e, em seguida, solicitando à IA que faça previsões simples, como a próxima palavra em uma sentença ou a ordem correta de uma sequência de frases. A rede neural recebe crédito ou culpa pelas respostas certas e erradas, por isso aprende com o processo até ser capaz de fazer boas previsões. Em última análise, a tecnologia baseia-se nos seus dados de treinamento e na sua aprendizagem para responder de forma humana a perguntas e outras solicitações.

Qual é um exemplo de IA generativa?

O exemplo mais conhecido de IA generativa hoje é o ChatGPT, que é capaz de conversar e escrever como uma pessoa sobre uma vasta gama de tópicos. Outros exemplos incluem Midjourney e Dall-E, que criam imagens, e uma infinidade de outras ferramentas que podem gerar texto, imagens, vídeo e som.

Qual é a diferença entre IA generativa e IA?

É importante observar que a IA generativa não é uma tecnologia fundamentalmente diferente da IA tradicional; elas existem em diferentes pontos de um espectro. Os sistemas tradicionais de IA geralmente executam uma tarefa específica, como detectar fraudes de cartão de crédito. A IA generativa geralmente é mais ampla e pode criar novos conteúdos. Isso ocorre em parte porque as ferramentas de IA generativa são treinadas em conjuntos de dados maiores e mais diversos do que a IA tradicional. Além disso, a tradicional é normalmente treinada através de técnicas de aprendizagem supervisionada, enquanto a generativa usa aprendizagem não supervisionada.

Qual é o risco da IA generativa?

Um grande debate está em curso na sociedade sobre os possíveis riscos da IA generativa. Extremistas de lados opostos do debate afirmaram que a tecnologia pode, em última análise, levar à extinção humana, por um lado, ou salvar o mundo, por outro. É mais provável que a IA conduza à eliminação de muitos empregos existentes. As empresas devem preocupar-se com a forma como a IA generativa irá impulsionar mudanças nos processos de trabalho e nas funções profissionais, bem como com o potencial para expor inadvertidamente informações privadas ou sensíveis ou infringir direitos autorais.

Para que serve a IA generativa?

A IA generativa pode ser utilizada de forma excelente em parceria com colaboradores humanos para ajudar, por exemplo, no brainstorming de novas ideias e na educação de trabalhadores em disciplinas adjacentes. Também é uma ótima ferramenta para ajudar as pessoas a analisar dados não estruturados com mais rapidez. De um modo mais geral, pode beneficiar as empresas, aumentando a produtividade, reduzindo custos, melhorando a satisfação do cliente, fornecendo melhores informações para a tomada de decisões e acelerando o ritmo de desenvolvimento de produtos.

O que a IA generativa não pode fazer?

A IA generativa não pode ter ideias genuinamente novas que não tenham sido previamente expressas nos seus dados de treinamento ou pelo menos extrapoladas a partir desses dados. Também não deve ser deixada sozinha. A IA generativa requer supervisão humana e só atinge o seu melhor em colaborações com pessoas.

Quais setores usam IA generativa?

Devido à sua amplitude, a IA generativa provavelmente será útil em praticamente todos os setores.

Como a IA generativa impactará o futuro do trabalho?

É provável que a IA generativa tenha um grande impacto no trabalho intelectual, atividades nas quais os humanos trabalham em conjunto e/ou tomam decisões de negócios. No mínimo, as funções dos trabalhadores terão de se adaptar em parcerias com ferramentas de IA generativa, e alguns empregos deixarão de existir. A história demonstra, no entanto, que mudanças tecnológicas como as esperadas da IA generativa conduzem sempre à criação de mais empregos do que à eliminação.