*Pablo Cavalcanti é CEO da Inmetrics
A IA open source começou a explodir ontem, mas já parece uma eternidade. Em 3 de março de 2023, vazou um conjunto de modelos LLM da Meta conhecido como Llama. Na época, os especialistas se dividiram em dois times. Um defendia o vazamento desse modelo de IA open source como a única forma de controlar o desenvolvimento de uma tecnologia potencialmente nociva à sociedade. Já o outro, culpava a Meta pelo que viria a ser uma onda de spam e golpes sofisticados implementados com a tecnologia.
Pouco mais de um ano depois, ambos passaram longe do que realmente aconteceria. Em janeiro de 2023 havia cerca de 100 mil modelos de IA open source disponíveis para uso público no Hugging Face, um repositório de modelos para desenvolvedores. Em novembro, mais de 400 mil já estavam disponíveis. Em maio, tínhamos 652.559 modelos de IA, 650% a mais que há pouco mais de um ano.
O GitHub, outro repositório fundamental de IA para desenvolvedores, viu um crescimento de quase 250% no número de repositórios de código de IA na comparação entre 2022 e 2023. Para 2024, o meu chute é que seja bem maior.
Em 2006, numa conferência para funcionários da Microsoft, o então presidente, Steve Ballmer, gritava a palavra desenvolvedores 14 vezes para dizer ao seu time que este era o público que definia o futuro de uma tecnologia. Esse público está mais do que comprado no modelo open source. O mesmo acontece com a IA.
Para quem trabalha no setor, tenho uma boa e uma má notícia. Caso você não imagine, a internet inteira hoje roda majoritariamente em software open source, o Linux. Sabe a cloud que você usa hoje? É toda baseada em Linux. A aquisição da Red Hat, a maior empresa privada de distribuição de Linux, pela IBM selou uma transformação irreversível. A infraestrutura que suporta a internet e os negócios hoje é totalmente dependente desse tipo de software, assim como a IA.
E por que isso é uma boa notícia? Por ter código aberto, os desenvolvedores podem fazer ajustes, resolver bugs, contribuir para evolução e corrigir furos de segurança rapidamente. Nada disso é possível com software proprietário, de código fechado. E é por isso que as soluções mais interessantes do ponto de vista de negócios fatalmente terão uma dose cavalar de open source embutida, como as de IA.
A má notícia é que esse trem já partiu, e em alta velocidade. Recalcule a rota se a sua empresa tem experimentos com IA 100% baseados em modelos como o OpenAI (já passou da hora de renomear essa empresa, não?) e se você acha um diferencial construir uma casquinha de software no modelo da big tech da sua preferência e compartilhar os seus dados e dos seus clientes com ela.
Você perdeu o trem na primeira estação, mas pode pegar um atalho e embarcar em outra. O modelo de IA mais novo da big tech da vez não é um diferencial, porque também está disponível para o seu concorrente. Construir o seu próprio modelo de IA do zero está fora de cogitação, pois custa milhões de dólares para treinar, já estará desatualizado quando estiver pronto e requer especialistas hoje escassos.
Qual é a saída?
A história das ondas de inovação de tecnologia (internet, cloud, mobile etc.) nos mostra o caminho para a IA, que é abraçar a onda open source, contribuir e receber de volta muito mais das comunidades que desenvolvem e evoluem esses modelos e os acessórios necessários para rodar uma aplicação.
Gosto de mapear o que está acontecendo no mundo de soluções de IA em três dimensões: vertical, horizontal e infraestrutura. Soluções verticais são construídas para resolver um problema muito específico, como um assistente de diagnóstico para médicos ou um sintetizador de proteínas para a indústria farmacêutica. Soluções horizontais são aquelas usadas por qualquer pessoa de qualquer indústria, como o ChatGPT. Já as soluções de infraestrutura são aquelas que permitem o uso da IA forma segura, escalável e transparente.
Nessas três frentes de IA, mas em particular nas duas últimas, a comunidade open-source tem trabalhado intensamente com lançamentos diários, feitos por gente no mundo inteiro, sejam pesquisadores, entusiastas, startups ou incumbentes.
Muita gente está desenvolvendo modelos de IA que podem ser usados para construir soluções que resolvem problemas do mundo real. E o melhor? A maioria dessas soluções tem custo zero de aquisição, mas não de operação. Operar requer infraestrutura e gente para funcionar. Mesmo não custando zero, as velocidades de implementação e personalização são muito importantes em dias em que os negócios digitais se movem muito rápido.
Assim como nas ondas disruptivas anteriores, veremos ondas menores e sucessivas transformando o panorama de IA diuturnamente. Pense no Netscape, ICQ e Hotmail, produtos que pavimentaram o caminho para ferramentas que os substituíram e assim por diante. Quem soube aproveitar essas ondas para inovar em diferentes setores fez dinheiro, construiu reputação de inovador e deu conveniência para um cliente cada vez mais digital e exigente.
As soluções de IA terão cada vez mais peças, serão mais robustas e resolverão problemas mais complexos. Quebrar tarefas mais difíceis em etapas mais simples e mesclar modelos permitem a você hoje, com uso majoritário de open-source, construir soluções que vão aumentar a produtividade do seu time, gerar retorno de investimento e capacitar sua empresa a surfar as ondas do futuro.
Se a sua empresa não tem essa capacidade, contrate quem possa lhe ajudar. Teste com os seus próprios dados, que são uma fonte única de diferenciação. É ao cruzar as soluções open-source com os seus dados que se criam as soluções de IA.
Comece por soluções internas para se familiarizar com a seleção de dados e construir soluções evitando defeitos para seus clientes finais. Ainda dá tempo de se sentar na janela do trem da IA open source. Já comprou sua passagem?