Como parte do meu trabalho, a cada semana eu leio muito conteúdo sobre dados, tecnologia e inteligência artificial (apelidada de IA). Eu faço uma seleção e envio para você os melhores, todos os domingos.
“ChatGPT agora pode ver, ouvir e falar”. Foi assim que a OpenAI, a empresa por trás do ChatGPT, descreveu esta nova versão que interage não apenas com texto, mas também com áudio e imagens. Nesta edição, faremos uma viagem ao estilo De Volta para o Futuro! Vamos separar O Joio do Trigo?
O chique é ser simples
Com todas essas novidades em IA generativa, grande parte da discussão gira em torno de como será o futuro. Fico pensando: e se pudéssemos fazer como no filme De Volta para o Futuro, indo dar uma olhadinha e depois retornar ao presente? O que será que encontraríamos?
Mesmo sem um DeLorean, já estamos vendo pitadas deste futuro hoje. O ChatGPT chamou muita atenção e falamos sobre isso em várias edições do nosso joio. A facilidade de uso fez com que o ChatGPT atingisse 1 milhão de usuários em apenas cinco dias, enquanto o Facebook precisou de 10 meses para atingir essa marca.
Nas últimas semanas a OpenAI lançou uma versão do ChatGPT com novas funcionalidades que permite iterações além do texto, ou seja, com áudio e imagens. A própria chamada que a OpenAI fez desta nova versão fala por si mesmo, em tradução livre: “ChatGPT agora pode ver, ouvir e falar”.
Ao entrar na plataforma do ChatGPT já surge o aviso dessas novas funcionalidades para os usuários:
Imagens e áudios são tipos de dados menos “organizados” (estruturados) e são mais difíceis de usar. Mesmo assim, eles representam muitas (talvez a maioria) das informações que temos e criamos todos os dias. Portanto, essa evolução é um habilitador (ainda maior) para essas novas tecnologias.
Como exemplo, peguei uma foto em que estou ao lado de uma réplica do DeLorean e a enviei ao ChatGPT, a mesma foto desta edição:
Pedi ao ChatGPT que identificasse os objetos na imagem. Fiquei impressionado com os detalhes. Ele reconheceu o carro como um DeLorean e associou-o ao filme De Volta para o Futuro. Além disso, notou que uso óculos, identificou a cor da minha camisa e a minha posição em relação ao veículo.
Por outro lado, solicitei ao ChatGPT que estimasse minha idade com base na foto. A resposta que recebi foi, traduzindo livremente: “Desculpe, não posso ajudar com isso”.
Considerando possíveis preocupações com privacidade, vamos tentar determinar o local onde a foto foi tirada apenas com base na imagem:
Com base apenas nos detalhes visuais da foto, como as tendas e a arquitetura dos prédios ao fundo, a IA sugeriu que a foto pode ter sido tirada em uma área urbana onde ocorrem eventos temporários ou festivais. Em seguida, solicitei as possíveis cidades no mundo onde essa foto poderia ter sido tirada:
Elaborei outra questão, incorporando algumas informações adicionais:
Se trata de um evento temporário, como você identificou pelas tendas. Além disso, o país é o Brasil, porém a cidade não é São Paulo. Faça uma análise mais detalhada da imagem e seus arredores, imagens e particularidades, como letras que possam indicar o local, vestimentas. Não use o carro como referência para essa análise
Autor
Na semana passada, tive a oportunidade de participar de um painel durante o Rio Innovation Week, evento que contou com mais de 150 mil participantes. Nesse painel, discutimos Inteligência Artificial, aprendizado de máquina e tendências. A foto foi tirada lá.
As respostas fornecidas pelo ChatGPT, obtidas em menos de cinco minutos, falam por si só.
A era da IA está apenas começando! 🙂
Notícias Interessantes em português
🔗 Link: Como a IA Generativa está transformando a Educação.
🔗 Link: Executivos de tecnologia ganham destaque na gestão com IA.
Enquanto isso na gringa…
🔗 Link: IA generativa vai ter uma espécie de choque de realidade em 2024.
🔗 Link: Microsoft anuncia novas ferramentas de IA para saúde.
Adoramos uma indicação!
Se você conhece alguém que possa gostar do nosso trabalho, agora você pode indicá-lo. A propósito, adoramos indicações!
até Domingo…
Sempre chegamos na sua caixa de entrada por volta das 12:08 PM. Alguns servidores de e-mail são teimosos e atrasam… Outros são piores ainda e nos jogam para o spam e/ ou promoções. Qual a lógica deste horário? …Nenhuma 🙂
Clique aqui para ler a notícia em seu site original
Diretamente de O Joio do Trigo