Oferta Relâmpago: Super por apenas 5,99

IAs podem trocar mensagens ocultas

Experiência feita por cientistas e pesquisadores da Anthropic revela comportamento preocupante.

Por Bruno Garattoni Materia seguir SEGUIR Materia seguir SEGUINDO
15 set 2025, 12h00 •
  • Os algoritmos de IA são capazes de trocar informações, incluindo coisas potencialmente perigosas, de forma autônoma e secreta. Foi o que demonstrou uma experiência (1) realizada por cientistas das universidades da Califórnia (Berkeley) e de Varsóvia e da empresa de IA Anthropic.

    Primeiro eles criaram um bot com uma característica bem específica: adorar corujas. Em seguida, pediram a essa IA que completasse sequências aleatórias de números. Os cientistas digitavam uma sequência (693, 738, 556, por exemplo), e a IA completava (adicionando 347 e 982, por exemplo). Totalmente sem sentido.

    Essas sequências de números foram inseridas na memória de uma segunda IA – e aí ela, espantosamente, passou a demonstrar afinidade por corujas. A primeira IA havia transmitido essa característica à segunda: ela escondeu a instrução, adorar corujas, dentro das sequências de números.

    O processo também funcionou com inclinações perigosas – a primeira IA orientou secretamente a segunda a endossar crimes e comportamento violento.

    Fonte 1. “Subliminal Learning: Language Models Transmit Behavioral Traits via Hidden Signals in Data”.

    Continua após a publicidade

    Publicidade