STJ abre inquérito para apurar fraudes com prompt injection em IA
STJ começa investigar “prompt injection” em documentos apresentados à Corte
O Superior Tribunal de Justiça (STJ) acendeu um alerta nas últimas semanas ao identificar em seu acervo de processos a presença de petições contendo “prompt injection”, uma sofisticada técnica de manipulação digital. Esta prática, que insere comandos ocultos em documentos ordinários, visa enganar modelos de inteligência artificial (IA), indicando uma nova frente de desafios para a segurança jurídica e tecnológica no país.
A “prompt injection” representa um método engenhoso para desviar o comportamento de sistemas de inteligência artificial, especialmente os grandes modelos de linguagem (LLMs). O ataque se materializa quando instruções maliciosas são incorporadas discretamente em textos como petições ou recursos, tornando-as imperceptíveis ao olho humano. O objetivo é forçar a IA a ignorar suas regras de análise predefinidas, manipulando os resultados sugeridos para favorecer uma das partes envolvidas.
Alerta no Judiciário Brasileiro
Embora o conceito de injeção de comandos não seja recente para especialistas em cibersegurança, sua manifestação no ambiente jurídico ganhou destaque nacional no início de maio, quando relatos de tentativas de fraude processual emergiram na Justiça trabalhista, especificamente no Tribunal Regional do Trabalho da 8ª Região (TRT8). Agora, a detecção de casos semelhantes no STJ eleva a gravidade da situação, exigindo uma resposta institucional robusta.
Diante do cenário, o presidente do STJ, ministro Herman Benjamin, confirmou que a corte está ativamente empenhada em apurar as tentativas de fraude processual. “O STJ Logos (sistema de IA generativa elaborado pela corte) já foi desenvolvido com comandos específicos que impedem estas artimanhas de atuar. Estamos mapeando todas as tentativas de prompt injection para permitir a aplicação de sanções processuais e a devida apuração de responsabilidade administrativa e criminal dos envolvidos”, afirmou o ministro.
Tecnologia de Defesa contra Ataques de IA
A segurança e a integridade processual foram prioridades absolutas desde as etapas iniciais do desenvolvimento dos sistemas de inteligência artificial do STJ, que culminarão com o lançamento do STJ Logos em fevereiro de 2025. Mesmo diante de petições que tentam usar a injeção de comandos, o sistema STJ Logos foi concebido com múltiplas camadas de segurança e integridade, garantindo que essas ordens maliciosas sejam neutralizadas e não executadas.
Para mitigar tais vulnerabilidades, o STJ Logos implementa uma estratégia de defesa em três níveis complementares. A primeira camada envolve um rigoroso pré-processamento, que assegura a segregação estrita entre instruções e dados, isolando e neutralizando comandos externos antes que alcancem o modelo de IA. O segundo nível estabelece uma delimitação de escopo contextual, prevenindo que diretrizes externas sobreponham as regras centrais do sistema. Por fim, a terceira camada aplica um filtro de conformidade, revisando as saídas geradas para garantir que os resultados estejam plenamente alinhados às políticas de segurança do tribunal.
Consequências Legais e Investigação no STJ
Para além das barreiras tecnológicas do STJ Logos, a Presidência do Superior Tribunal de Justiça determinou medidas legais e administrativas adicionais. Todas as tentativas de “prompt injection”, mesmo as que foram ineficazes, passarão a ser certificadas nos autos dos processos. Essa certificação permitirá que ministros e ministras apliquem as devidas sanções processuais aos advogados e escritórios envolvidos.
Complementarmente, foi definida a instauração de inquérito policial e de procedimento administrativo. Estas ações visam aprofundar a apuração dos fatos, com a oitiva dos advogados e escritórios implicados, podendo culminar em responsabilização criminal e correicional, reiterando o compromisso do STJ com a integridade do ambiente jurídico frente às novas ameaças digitais.
Fonte e Fotos: ROTA JURÍDICA
https://www.rotajuridica.com.br/stj-comeca-investigar-prompt-injection-em-documentos-apresentados-a-corte/
