fabriciocarraro Profile Banner
Fabrício Carraro Profile
Fabrício Carraro

@fabriciocarraro

Followers
5K
Following
19K
Statuses
9K

Viajante, poliglota, autor de IA e host dos podcasts Dev Sem Fronteiras e IA Sob Controle 🤖 Línguas: 🇧🇷🇮🇹🇬🇧🇷🇺🇵🇱🇪🇦🇫🇷🇩🇪🇬🇷🇳🇱🇮🇱🇷🇴🇹🇷

Barcelona, Spain
Joined April 2009
Don't wanna be here? Send us removal request.
@fabriciocarraro
Fabrício Carraro
1 year
PUBLICADO! 😍🤯 É com grande alegria e orgulho que venho anunciar que foi lançado o meu primeiro livro: "Inteligência Artificial e ChatGPT: Da revolução dos modelos de IA generativa à Engenharia de Prompt", publicado pela Casa do Código.
3
6
44
@fabriciocarraro
Fabrício Carraro
12 hours
Apenas um passeio tranquilo de tarde em 2025 🤖
0
0
2
@fabriciocarraro
Fabrício Carraro
1 day
Quem chegou aqui hoje! 700 páginas de IA e Machine Learning 🤓
Tweet media one
0
0
11
@fabriciocarraro
Fabrício Carraro
3 days
@melcarraro Fia, te mandei mensagem do zap, vai lá ver 😅
1
0
0
@fabriciocarraro
Fabrício Carraro
4 days
@tunguz I must say I'm a bitch for Italian food and find Spanish boring (since I don't eat fish or seafood in general). I surprisingly love Polish food though.
0
0
0
@fabriciocarraro
Fabrício Carraro
4 days
Hoje no @devsfronteiras falei com o Nicholas, que começou em Educação Física, mas mudou pra Eng. Elétrica e seguiu na carreira acadêmica. Hoje, ele faz doutorado em IA na Universidade de Bonn, na Alemanha, e conta tudo sobre essa jornada! 🇩🇪
0
0
0
@fabriciocarraro
Fabrício Carraro
5 days
0
0
1
@fabriciocarraro
Fabrício Carraro
6 days
@melcarraro Woo hoo! Lente é ok, mas a cirurgia é 😍😍 fiz em 2016 ou 17, melhor coisa da vida! Haha
0
0
0
@fabriciocarraro
Fabrício Carraro
6 days
@MiguelNicolelis Com certeza! Foi um avanço gigantesco, tô doido pra entrevistar alguém de lá no meu podcast.
0
0
0
@fabriciocarraro
Fabrício Carraro
7 days
A evolução das IAs não para de me surpreender. 🤯 Esse gráfico abaixo representa a evolução dos modelos de #IA no teste GPQA. O GPQA (A Graduate-Level Google-Proof Q&A) é um benchmark criado para avaliar a capacidade de raciocínio e resolução de problemas complexos, além de medir o conhecimento em nível PhD. O diferencial dele teste é que ele foi projetado para ser “à prova do Google”, ou seja, mesmo PhDs com acesso ilimitado à internet não conseguiriam obter as respostas tão fácil ou diretamente. Em janeiro de 2024, o modelo GPT-3.5 Turbo tinha alcançado ~37% de acerto no GPQA. Esse nível de desempenho é equivalente ao de um PhD respondendo questões fora da sua especialidade, mesmo com acesso ao Google. Poucos meses depois, em maio de 2024, o GPT-4o conseguiu atingir ~56% de acerto, superando o desempenho desses mesmos PhDs fora da sua área de atuação, mas ainda abaixo dos especialistas que respondem dentro da sua própria área. No final de 2024, o cenário mudou significativamente (notem o gradiente da curva). Os o1-Pro da OpenAI evoluiu a ponto de atingir 80% de acerto, praticamente igualando o desempenho de PhDs que respondem dentro da sua área especialidade E com acesso ao Google. E agora chegamos a 2025, e vemos algo bastante impressionante: o mais novo modelo de reasoning (racionínio) da OpenAI (o o3) já está chegando à marca de 90% de acertos, superando até mesmo os PhDs mais experientes em suas próprias áreas e com acesso ao Google (que ficam nos ~81%). E isso porque esse gráfico nem considera ainda o novo modelo o3 final com Deep Research, lançado hoje (03/Fev/2025) pela OpenAI. Esse progresso rápido e consistente não se trata apenas de uma melhora na capacidade de buscar informações na internet. O GPQA é desenhado especificamente pra testar o raciocínio crítico de uma pessoa (ou máquina) e a sua capacidade de resolver problemas complexos. Em menos de um ano, vimos uma transição de modelos com desempenho mediano para sistemas que agora superam PhDs humanos em suas próprias áreas de conhecimento e com acesso ilimitado à internet. A questão que podemos trazer e filosofar sobre é: o que isso significa para os próximos avanços da ciência e pesquisa? No mínimo, vejo que esses modelos serão essenciais para ajudar pesquisadores durante o processo do PhD, seja dando ideias, insights ou revisando os trabalhos finais para garantir que as sugestões e provas estão corretas e bem suportadas. Além disso, podemos tentar extrapolar e prever agentes de IA, como esses do Deep Research, começando a propor novas ideias. Claro, isso é apenas uma extrapolação inocente, mas nesse ritmo exponencial, alguém realmente duvida que isso será possível daqui a 12 meses?
Tweet media one
0
1
8
@fabriciocarraro
Fabrício Carraro
7 days
Com o lançamento do novo modelo o3-mini da @OpenAI, criei um novo gráfico de comparação, mantendo os modelos @deepseek_ai R1 e OpenAI o1, e adicionando o o3-mini. Note a diferença entre os modos de esforço "low", "medium" e "high" do o3-mini, e também que, apesar de ser MUITO mais barato que o o1 (e até melhor), continua sendo um pouco mais caro que o DeepSeek-R1. Porém, no esforço "high", ele é até melhor que o R1. Novamente, deixo claro que ele deixa muita coisa de fora, mas serve para demonstrar a diferença de custo e a comparação de qualidade em benchmarks de matemática e programação.
Tweet media one
1
0
5
@fabriciocarraro
Fabrício Carraro
8 days
A @OpenAI surpreendeu hoje com uma live de última hora anunciando o "Deep Research", e dessa vez é MUITO mais do que apenas mais um modelo de IA! 🤯 Basicamente, é um agente que consegue fazer pesquisas complexas na internet, analisando CENTENAS de fontes diferentes, e gerar relatórios completos com todas as referências. Sabe aquela pesquisa que você levaria horas (ou dias) fazendo? Você passa os requerimentos detalhados, ativa o Deep Research, e ele retorna minutos depois com um relatório completo pronto, citando todas as fontes. O mais interessante é que ele é baseado no o3 (aquele que ainda nem foi lançado oficialmente), mas com um treinamento específico em Aprendizado por Reforço, com esse foco em busca agêntica. Além disso, removeram as restrições de latência - ou seja, ele pode pesquisar por 5, 10, até 30 minutos se precisar, algo que nenhum outro modelo faz hoje. Algumas features que me chamaram a atenção: 👉 Consegue usar Python pra gerar gráficos e análises 👉 Pode analisar e incluir imagens dos sites pesquisados no relatório 👉 Cita a fonte exata de onde tirou cada informação 👉 Mostra em tempo real os passos que está seguindo na pesquisa No benchmark "Humanity's Last Exam" (um teste MUITO difícil com mais de 3000 questões de especialistas), ele alcançou 26.6% de acurácia. Pra comparação, o o1 tinha atingido 9.1% e o DeepSeek-R1 9.4%. Esse novo modo já está disponível hoje mesmo pra quem tem o plano Pro (com limite de 100 consultas/mês). Logo mais vai chegar pro Plus e Teams. Infelizmente, ainda não tem previsão pra Europa e UK (aquela história de sempre...). Uma coisa que disseram é que essas pesquisas são "muito custosas computacionalmente". Alguém vai pagar essa conta - usuários Enterprise, ou um possível vindouro IPO? Quem sabe, até o Projeto Stargate 😅 Uma coisa que achei curiosa: o nome "Deep Research" é o mesmíssimo nome dado ao modo de busca na internet do Google Gemini. Estranho não terem escolhido algo mais "único". Talvez o mercado todo adote esse nome pra essa funcionalidade agêntica então. Mas bom, eles deixaram claro que isso é só o começo e que pretendem integrar isso com o Operator (aquele agente que consegue tomar ações no mundo real) pra criar experiências ainda mais complexas. Ah, e claro, como sempre, vamos destrinchar esse lançamento no podcast "IA Sob Controle". 🎧 Eu, honestamente, acho que o Deep Research tem um potencial de ser extremamente útil, muito mais do que o Operator (no curto prazo pelo menos). Já me vejo usando em diversas situações de pesquisa. E você, o que achou?
Tweet media one
0
0
22
@fabriciocarraro
Fabrício Carraro
9 days
@melcarraro Por ter crescido em Santo André, eu idem 😅
0
0
0
@fabriciocarraro
Fabrício Carraro
10 days
O presente misterioso me pegou 😅
Tweet media one
0
0
1