📰 Omni, a nova geração

caminhões, GPT-4o e edtechs

14 de maio, Terça 

A turma da DW Brasil fez este vídeo bacanudo sobre a disputa de caminhões elétricos e de hidrogênio, com os prós e contras de cada fonte de energia. Vale o view. 

Perdeu a news de ontem? Ouça aqui 👇

Recebeu a news de um amigo?
Clica aqui do lado para se inscrever

Imagem: Giphy

Tudo em um só lugar 

Novidade que promete sacudir a corrida pela IA: ontem (13) a OpenAI anunciou o GPT-4o (“o” vem de “omni” — “todo”, em PT-BR), a atualização do modelo por trás do ChatGPT. Segundo a empresa, “é um passo em direção a uma interação humano-computador muito mais natural”, que inclui texto, imagens e voz. 

Legal, e na prática? Dá para conversar com a IA, avaliar detalhes e informação em vídeos, aprimorar imagens, fazer tradução simultânea, ter um guia de estudos, personal stylist e mais. 

O “omni” é duas vezes mais rápido do que GPT4-Turbo e custa metade do preço desse antecessor, de acordo com a OpenAI. 

A tech em detalhes 

Antes disso, o Modo Voz do modelo envolvia um pipeline de três modelos separados:

  • simples, que transcrevia áudio em texto (GPT-3.5);

  • recebia texto e gerava texto (GPT-4);

  • convertia esse texto de volta em áudio. 

Só que, conforme a OpenAI, nesse processo o GPT-4 perdia detalhes e habilidades, pois não conseguia observar tom, diversos ruídos ou alto-falantes de fundo nem produzir risadas, cantar ou expressar emoções. 

🐈Daí veio o pulo do gato: o treinamento do GPT-4o contou com um único (e novo) modelo de ponta a ponta com texto, imagem e áudio. Assim, todas as entradas (input) e saídas (output) são processadas pela mesma rede neural. 

O Modo Voz para interagir com o GPT-4 trazia resposta de 5,4 segundos em média. Agora, esse tempo é de 232 milissegundos – ritmo similar ao humano. 

Aliás, a interação entre uma pessoa e a IA é tão, mas tão natural que nos lembrou a Samantha do filme Her

Da interação ao look 

Um dos recursos destacados pela empresa é de tradução simultânea, que traz suporte para 20 idiomas (incluindo português). Veja só:

Outra possibilidade é abrir a câmera do celular e mostrar uma equação matemática para que a IA verifique se as contas estão sendo feitas corretamente. 

O “omni” ainda atua como personal stylist: basta tirar uma selfie e pedir dicas de looks. De modo similar a um assistente, ele também conta histórias, cuja voz pode ter diferentes focos — canto, conversa e narração —, além de entonação, como alegre, triste e robótico. 

Gemini x omni 

A OpenAI exibiu também 17 modelos com inputs em texto e outputs variados, que vão desde a sumarização de uma reunião até criação de objetos 3D e aprimoramento de imagens.  

🌊Mas segure a onda: a empresa alertou que está explorando as capacidades do modelo e suas limitações. Ainda assim, usuários da versão Plus (ou paga) já têm acesso às atualizações de texto e imagem.

O Modo Voz, porém, estará disponível na versão alfa nas próximas semanas. A turma dev terá acesso à API como modelo “visual” (imagens) e texto “em breve”.  

Amostra da opção “3D objects synthesis” do GPT-4o que cria objetos 3D. Fonte: OpenAI/reprodução.

Tudo explicado, mas qual o impacto do GPT-4o na corrida? 

A Google possui o Gemini, que combina IA ao seu motor de busca. “Por fora”, existe a assistente inteligente, Tradutor e um novo personal sylist (disponível nos EUA), integrado ao buscador, que aprimora a experiência de compra com histórico de interesses do usuário. 

Integração é a alma do negócio?

A Meta, por sua vez, está empenhada em levar a IA para seus produtos físicos e digitais: 

  • Os novos óculos RayBan combinam a experiência digital com o físico o que inclui uma assistente com tradutor simultâneo, personal stylist e guia turístico. 

  • Suas redes sociais ganharam uma ferramenta de IA que cria campanhas, desde imagem a textos.  

E, embora a Microsoft esteja trabalhando em uma IA própria, ela pode se beneficiar das novidades, afinal possui uma parceria ($) com a firma de Sam Altman.  

Pensando friamente, a OpenAI fez um hub com todos esses recursos muito aprimorados - o que a coloca em vantagem no mercado. As demais empresas estão utilizando a IA de maneira estratégica, portanto, em produtos que façam sentido no momento ($). 

Aliás, com seu ecossistema já “pronto” talvez a Google possa tentar algo similar a uma integração de IAs – enquanto isso, a divisão de nuvem tem faturado alto com a tech.  Voltaremos com mais informações... 

🚨Boletim Brifão - Rio Grande do Sul

Foi-se a chuva, chegou o frio: o momento para a população é de esperar a redução do nível das águas, que está altíssimo.

Aqui está um rápido balanço do que rolou do final de semana até segunda (13): 

  • A cidade de Caxias do Sul exibiu 2 tremores na madrugada de domingo para segunda: abalos chegaram a 2,3 graus, mas não houve risco para população. 

  • Foi criado um “corredor humanitário” de maneira provisória em Porto Alegre, próximo à Rodoviária. Só em 24h mais de 100 veículos atravessaram o local.

  • Devem vir ondas de doença, como leptospirose, hepatite e dengue. O RS, porém, pena com hospitais inundados e perda de medicamentos.

  • Fake news no Zap atrapalham os trabalhos no estado. A jornalista Talita Burbulhan, por exemplo, fez uma investigação que envolveu até um comércio na Turquia. 

No sábado, deixamos um pequeno guia de como fazer doações seguras. 

Obs.: traremos amanhã o resultado do poll postado na segunda. 

Mercado e negócios

Fuuusão?

O ano tem sido de frustração para quem esperava aquecimento em fusões e aquisições (M&A, na sigla em inglês). Depois do boom nesse segmento na pandemia, em 2023 houve uma significativa queda que não deve ser revertida em 2024. 

São vários os motivos: a expectativa de que a taxa de juros norte-americana voltará a ficar acima do normal, a queda menos acentuada da Selic por aqui e a previsão de que o déficit fiscal não será zerado pelo governo federal conforme o esperado. 

Mesmo assim, vale lembrar grandes fusões deste ano, como: 

  •  Petz + Cobasi 

  •  Grupo Somma + Arezzo 

  • Enauta + 3R.  

Mesmo assim, o volume total de USD 10,6 bilhões ainda é 11,2% abaixo do ano passado. Foram 327 operações de M&A desde o começo do ano, ou 6,2% a menos que no mesmo período de 2023. 

Redes sociais e plataformas digitais

Queda de uns, negócio de outros

O possível banimento do TikTok dos EUA tem feito outra big tech sorrir à toa: a Google, que tem visto isso como uma oportunidade de negócio. Na prática, a companhia pretende lucrar com publicidade, já que um grande player sairia de circulação no país. 

👀Segundo um documento interno, os responsáveis pelas vendas de anúncios devem aproveitar esse argumento para ampliar as inserções no YouTube. A ideia é reforçar a segurança do líder do setor de entretenimento em vídeo.  

As orientações também incluem a exaltação de um padrão de mensuração de resultados mais efetivo do que o da rede social chinesa, que supostamente infla os resultados ao seu bel prazer.

Os retornos já são visíveis, com aumento de 21% na receita do YouTube no primeiro trimestre de 2024 – o maior começo de ano da história do serviço. 

Startups

Edtechs: desempenho em baixa

O Brasil é um polo fervilhante de educação na América Latina, ao menos no quesito edtechs. Do total de 898 startups educacionais da região, 68,93% são brazucas.  

O pódio é finalizado pelo Chile (com 7,91%) e Colômbia (7,13%), segundo dados da Distrito. 

No entanto, o levantamento mostra que os aportes nessas companhias seguem em queda: de USD 271,5 milhões, em 2021, para USD 33,8 milhões, no ano passado. Em 2024, até o momento, foram apenas USD 5,6 milhões. 

A Distrito destaca também que as IAs generativas, principalmente na geração de conteúdo personalizado, devem ser o grande diferencial nos próximos anos.  

Produto

Demorou, mas vai chegar 

A Microsoft anunciou que irá lançar sua loja de jogos para plataformas móveis em julho. A ideia é concentrar alguns de títulos de maior sucesso, como Candy Crush e Minecraft, além de atrair desenvolvedores para o espaço. 

A princípio, a loja será on-line, para poder ser acessada de qualquer lugar do planeta. Para refrescar a memória, plataformas da Apple e da Google chegam a cobrar até 30% de taxas em apps, algo que pode ser bem menor em um serviço hospedado na web.  

A ideia de uma loja de jogos circula por aí desde 2022, quando a big tech tentou comprar a Activision Blizzard. No mesmo ano, o registro da plataforma Xbox Mobile aumentou o rumor, mas só agora o projeto vai ver a luz do Sol. 

TL;DR

Ainda mais little e mais BRIEF

👨‍⚖️A Zoox, empresa de táxis autônomos da Amazon, está sob investigação após dois acidentes envolvendo motos. 

👜A Shein tem tentado fazer seu IPO nos EUA, mas, diante de tantos impasses, deve acabar abrindo o capital na bolsa de Londres. 

⛹️‍♂️A venda de euros aumentou 31% em abril no Brasil. O motivo? Os Jogos Olímpicos de Paris, em julho. 

📈As ações da GameStop valorizaram 74%, depois que Keith Gill, o responsável pela megavalorização inicial da companhia, retornou às redes. 

A Redação Recomenda

Achados para ler, ouvir e assistir

humbição! (leitura, 2min, em português) 
liderar com humildade é possível 

4 micronações que lutam para serem independentes (leitura, 3min, em português) 
tem de regiões dos eua à coreia do sul 

como conduzir conversas difíceis (leitura, 4min, em inglês) 
diminuindo b.o.s 

como financiar a casa própria sem entrada: é possível? (vídeo, 60min, em português) 
spoiler: sim, mas é preciso abrir mão de algumas coisas 

Esperar pela perfeição nunca é tão inteligente quanto progredir.  

Seth Godin 

O que achou da news de hoje? 🕵️

Conte aí embaixo pra que possamos melhorar nosso conteúdo!

Faça Login ou Inscrever-se para participar de pesquisas.