IA tem fome de quê?

Humanos alimentando algoritmos

16 de maio, sexta-feira

Em 1929 acontecia a primeira cerimônia do Oscar. Quinze prêmios foram distribuídos e toda a festa da sétima arte durou apenas 15 minutos. Se você curte filmes ou séries, te damos a dica: leia o Minha Série. Dicas, resenhas e notícias com a chancela do Brifão. De nada. 😉

⚡ O que você vai ver?

Recebeu a news de um amigo?
Clica aqui para se inscrever

INTELIGÊNCIA ARTIFICIAL
IA TEM FOME DE QUÊ?

Imagem: Giphy

Por Andre Gonçalves

Encontrar dados de alta qualidade para treinar modelos de inteligência artificial não é mais uma tarefa tão fácil como na época em que a tecnologia começou a se popularizar, o que nem faz tanto tempo. Enfrentando processos por violações de direitos autorais, os principais players do setor estão em busca de alternativas  — OpenAI e Microsoft que o digam.

Usar dados sintéticos é uma delas, embora a prática também tenha riscos. Gerados pelos próprios bots, eles podem apresentar erros e informações inventadas, fruto da alucinação das IAs. Lembra do Google Gemini adicionando homens negros e mulheres asiáticas em fotos de soldados alemães da Segunda Guerra geradas artificialmente? Pois é.

Se a opção anterior não surge como a melhor solução, onde as empresas conseguirão encontrar uma quantidade incontável de textos sobre qualquer assunto e escritos por humanos (quase sempre), opiniões, comentários, fotos e vídeos, sem o risco de serem processadas? Sim, você acertou, nas redes sociais.

🪙A própria mina de ouro

Sedenta por mais dados para treinar o ChatGPT, a OpenAI estaria se preparando para lançar sua própria rede social que também funcionaria como um repositório de dados para a IA generativa pioneira. Pessoas por dentro do assunto contaram ao The Verge que a startup pretende lançar uma plataforma semelhante ao X.

Ainda não está claro se a suposta rede social da OpenAI seria integrada ao chatbot ou ganharia um app separado e não há nenhuma garantia de que ela realmente sairá do papel. Porém, o CEO, Sam Altman, tem pedido opiniões sobre o projeto a pessoas próximas, segundo o rumor, dando indícios de que vai mesmo investir na área.

Caso a iniciativa seja lançada, a empresa terá a sua própria mina de ouro para treinar o ChatGPT em tempo real usando as postagens, assim como já faz o antigo Twitter alimentando a IA Grok. A Meta é outra que segue a prática, treinando o modelo Llama com as informações e postagens dos usuários do Facebook, Instagram e Threads.

🫦Entenda: todos te querem!

E não é só a dona do ChatGPT que quer começar a usar as redes sociais para o treinamento de modelos de linguagem. De olho nessa fonte quase inesgotável de material para alimentar os bots, a Perplexity.ai fez uma oferta para comprar o TikTok, em março, pensando em integrar o app de vídeos ao seu buscador baseado em IA.

“Isso forneceria aos usuários respostas abrangentes e bem citadas que combinam o melhor mecanismo de resposta do mundo com uma das maiores bibliotecas de conteúdo gerado pelo usuário”, comentou a startup, na época, explicando sobre o que faria com o vasto material disponível na plataforma de origem chinesa. 

Quem também estaria interessada em assumir a operação do TikTok nos EUA é a Amazon, com rumores sugerindo que a gigante do comércio eletrônico fez uma proposta de última hora à ByteDance, controladora do app. Teremos a nova Alexa turbinada com IA usando os milhões de vídeos postados diariamente para ficar mais inteligente? Só o tempo dirá.

🖋️Assine aqui, por favor

Você pode não ter percebido, mas as big techs estão se preparando para usar seus dados e posts no treinamento de algoritmos há algum tempo. Sem muito alarde, elas têm feito mudanças nas políticas de privacidade das redes sociais para garantir que a coleta e o tratamento dessas informações não viole nenhuma lei.

Por isso, a Autoridade Nacional de Proteção de Dados (ANPD) chegou a proibir a Meta de treinar sua IA com dados de brasileiros, mas a coleta foi liberada após o cumprimento de exigências. Uma delas era avisar os usuários sobre a prática e oferecer a opção de não liberar as postagens para o algoritmo.

De maneira geral, outras redes sociais também fornecem meios de controlar o uso dos seus dados, mas nem sempre é fácil encontrar esses ajustes. Além disso, é provável que elas estejam se alimentando dos seus posts há muito tempo, exceto se você impediu o compartilhamento quando criou a conta. Já revisou suas configurações de privacidade hoje?

Ajude o brifão a ficar ainda melhor. Quebra essa e responde a pesquisa!

THE BRIEFCAST
A GEN Y ESTÁ EM CRISE?

Levamos esse papo pra 3ª temporada do The BRIEFcast.
Episódio da Geração Y já disponível.

✍️ Resumão do Brifão (um remember do que rolou na semana)

🦜 Frase do dia

“Quanto menos dados precisarmos, melhor a informação.”

Peter Drucker

O que achou da news de hoje? 🕵️

Conte aí embaixo pra que possamos melhorar nosso conteúdo!

Faça Login ou Inscrever-se para participar de pesquisas.

Somos o The BRIEF, o briefing diário de inovação, tecnologia e negócios com inteligência e personalidade pra quem precisa estar por dentro de tudo sem perder tempo e o bom humor. Uma criação original do TecMundo.