Poucas tecnologias e inovações alcançaram tão rápido crescimento em seu uso quanto a do ChatGPT. De acordo com a OpenAI (1), o ChatGPT adquiriu 1 milhão de usuários somente 5 dias depois do seu lançamento em novembro de 2022 (2). Mas o que é o ChatGPT, qual a razão do estrondoso sucesso, e que economia ela representa?

De acordo com Elliot Alexander (3) a maioria das pessoas estava familiarizada com algoritmos, poucos com Machine Learning (Aprendizado de Máquina), e uma margem ainda menor estava familiarizada com o conceito de “reinforcement learning” (aprendizagem por reforço). Esses algoritmos eram caixas pretas, bits assustadores de tecnologia misteriosa dentro de companhias big-tech projetados para empurrarem propaganda relevante.

No entanto, do dia para a noite o ChatGPT dominou o ciclo de notícias de tecnologia à medida que demos (demonstrativos) impressionantes de suas capacidades foram sendo descobertos. Logo, as pessoas se encantaram com o poder dos “large-language models” (LLMs) (grandes modelos de linguagem). Como resultado, a AI – Artificial Intelligence (IA - Inteligência Artificial) rapidamente se moveu de um “slowly building hype” (moda vagarosamente constituída) para ser a mais “nova estabelecida fronteira da tecnologia”.

Apesar dos LLMs já terem sido desenvolvidos há anos, o ChatGPT foi a primeira demonstração real do poder da AI que apareceu para o público. É a coisa mais próxima da ilusão da verdadeira Artificial General Intelligence – AGI (4). Com este sucesso, emergiu a questão: de onde vem todos esses dados? O acesso aos dados para treinar os LLMs está mudando fundamentalmente como dados disponíveis estão na internet, e isso é um problema que não vai sumir tão cedo.

Desta forma, pergunta Alexander (3), como os LLMs são treinados? O GPT precisa de dados – e muitos dados! LLMs como o ChatGPT requerem massivas quantidades de dados para “absorver” em seus modelos, dando a eles o conhecimento que nós vemos sem a necessidade de acesso à internet. Esses modelos são “treinados” nestes dados, e enquanto modelos têm ficado mais e mais poderosos, isso requer mais e mais dados. Para entender por que dados são tão importantes para os modelos GPT, faz-se necessário uma breve olhada em sua história.

Em 2017, Google publicou sua “transformer architecture” (arquitetura transformadora) (Figura 1 à frente) de “artificial neural networks” (ANNs), a qual forma o alicerce do ChatGPT agora. Transformers melhoraram consideravelmente as capacidades das redes neurais para considerarem contexto e reduzirem dramaticamente o volume de dados traináveis padronizados requeridos. Dados treináveis padronizados são dados que são modificados com padrões ou categorias para adicionarem contexto ou significado adicional. Os Transformers representam um significativo ponto de inflexão no desenvolvimento de redes neurais de processamento de linguagem natural, e seu sucesso estimulou a OpenAI a adotar um modelo similar, e a expandir nele seus novos GPT – General Pre-Trained Transformer – models (3).

Esses Transformers são treinados (ou pré-treinados, no léxico dos LLMs) com objetivos baseados em torno da próxima sentença e da próxima predição de palavra – i.e., dados tanto de uma palavra ou frase em contexto, quanto prevendo a palavra ou sentenças seguintes. Isto é feito usando uma função de premiação – uma função matemática que alimenta de volta quão “boa” cada resposta é para o modelo, permitindo-o ajustar e otimizar.

À parte dos meandros da tecnologia, o ChatGPT está contribuindo para intensificar o debate sobre a IA na economia e na sociedade. Uma das maiores preocupações (pelo menos entre os economistas) é o impacto da IA no mercado de trabalho. Zarifhonarvar (5) por exemplo, argumenta em seu trabalho que consequências positivas e negativas da Generative AI (como ChatGPT) no mercado de empregos são antecipadas como sendo substanciais. Por um lado, ele antecipa que elas podem levar ao deslocamento de trabalhadores, particularmente aqueles que fazem trabalhos rotineiros. Este deslocamento pode levar ao desemprego, salários decrescentes, e um aumento na desigualdade de renda. Por outro lado, AI,em geral, pode gerar novas possibilidades de empregos, particularmente em ocupações de altas habilidades, e podem melhorar a produtividade e o crescimento econômico.

Em resumo, a discussão sobre os impactos da IA apenas está se iniciando. O ChatGPT é apenas a “ponta do iceberg” de uma grande onda de inovações tecnológicas que estão porvir. Aprofundar no seu entendimento para tomadas de decisões mais inteligentes é o nosso papel!

Se sua empresa, organização ou instituição deseja saber mais sobre modelos de IA como o ChatGPT, não hesite em nos contatar!

  1. Laboratório de pesquisa de Inteligência Artificial estadunidense, fundado em 2015, que consiste na organização sem fins lucrativos OpenAI Incorporated e sua subsidiária com fins lucrativos OpenAI Limit Partnership.
  2. Estima-se que ChatGPT atingiu 100 milhões de usuários mensais ativos em janeiro de 2023, ou seja, dois meses do seu lançamento. Isto a tornou a aplicação que mais cresceu na história, somente superada pelo Threads (da Meta) m julho de 2023: https://explodingtopics.com/blog/chatgpt-users.
  3. https://www.xda-developers.com/one-of-ais-biggest-changes-already-here/
  4. Capacidade hipotética de um agente inteligente de compreender ou aprender qualquer tarefa intelectual que um ser humano possa. É o objetivo principal de algumas pesquisas sobre IA e um tópico comum em ficção científica e estudos futuros: https://en.wikipedia.org/wiki/Artificial_general_intelligence
  5. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4350925

Figura 1 – O “Transformer” – modelo de arquitetura

I01F1

Fonte: https://arxiv.org/abs/1706.03762