JUDIT e a revolução do acesso à Justiça com o poder da AWS

A JUDIT nasceu com um objetivo claro: organizar e tornar acessíveis milhões de processos judiciais do Brasil em tempo real, entregando dados jurídicos estruturados para decisões mais eficientes em segmentos como financeiro, antifraude, cobrança e advocacia empresarial.

Desde o início, a empresa escolheu a AWS como base de infraestrutura justamente para garantir escalabilidade, resiliência e segurança. Consequentemente, em seu primeiro ano de operação comercial, a plataforma atingiu a marca de mais de 30 milhões de requisições mensais, armazenando 4 TB de dados jurídicos. Além disso, passou a atender a mais de 100 clientes corporativos, entre eles nomes relevantes como SPC Brasil, PicPay, B3, Neoway, Jusfy, Pinheiro Neto e Nelson Wilians.

O desafio de estruturar o caos jurídico nacional

O sistema judicial brasileiro é extremamente fragmentado: são centenas de tribunais, com sistemas próprios, interfaces inconsistentes e estruturas de dados não padronizadas. Dessa forma, para oferecer uma experiência de consulta unificada, a JUDIT precisou ir além do que já existia no mercado.

Hoje, a JUDIT é a única empresa de dados jurídicos no Brasil que oferece uma API capaz de consultar tanto um datalake próprio quanto realizar buscas em tempo real nos sistemas dos tribunais. Portanto, isso garante que nossos clientes tenham acesso ao dado mais atualizado possível, mesmo em situações em que o processo ainda não foi indexado nas bases tradicionais.

Para tornar isso viável e competitivo, mesmo em um setor com mais de 15 anos de players estabelecidos, a equipe da JUDIT desenvolveu soluções proprietárias de alta performance:

  • Framework próprio de captura de dados, leve e eficiente, que permite capturar dados com menor custo computacional e maior controle sobre falhas.
  • Infraestrutura de proxies e resolução de captchas, que reduz significativamente o custo operacional e aumenta a taxa de sucesso das capturas.
  • Pipelines distribuídos e otimizados por tribunal, que permitem paralelismo massivo na coleta de dados.

Arquitetura 100% cloud-native, orientada a eventos

A infraestrutura da JUDIT foi construída com base em microserviços event-driven. Com isso, cada etapa da cadeia — captura, enriquecimento, curadoria e entrega de dados — opera de forma desacoplada e resiliente, permitindo escalar de forma independente e evitar gargalos.

SNS + SQS: backbone de comunicação entre microserviços

A comunicação entre os 9 microserviços ativos da JUDIT é feita por Amazon SNS + Amazon SQS, o que garante:

  • Processamento assíncrono com alta performance
  • Tolerância a falhas e reprocessamento automático
  • Escalabilidade horizontal independente por serviço

ECS com Fargate + Lambda: computação serverless e escalável

  • Amazon ECS com Fargate hospeda APIs e workers de processamento intensivo, como o microserviço de crawler, com auto scaling configurado.
  • Enquanto isso, a AWS Lambda processa eventos de menor duração e alta frequência com resposta imediata.

S3 + CloudFront: armazenamento e distribuição eficiente

  • Amazon S3 armazena históricos de atualizações processuais, anexos e arquivos em Parquet.
  • Consequentemente, o Amazon CloudFront entrega esses arquivos de forma rápida e com baixa latência aos clientes distribuídos no Brasil.

Segurança ponta a ponta

  • Amazon Cognito: autenticação de usuários com API Key e Bearer Token
  • AWS IAM: controle de acesso refinado entre recursos e usuários
  • AWS Secrets Manager: gerenciamento seguro de variáveis sensíveis
  • Amazon VPC: ambientes de produção, staging e desenvolvimento isolados

Cache, observabilidade e automação

  • Amazon ElastiCache (Redis): cache de metadados e autenticações
  • Amazon CloudWatch: logs e métricas em tempo real com alertas configurados
  • Amazon EventBridge Scheduler: execução de crons distribuídos para rotinas como monitoramento de processos e ingestão de novos dados

Integrações externas

  • MongoDB Atlas: usado como banco principal de dados jurídicos, com integração via VPC Peering que elimina custo de transferência e reduz latência.
  • Amazon ECS com Fargate hospeda APIs e workers de processamento intensivo, como o microserviço de crawler, com auto scaling configurado.
  • AWS Lambda processa eventos de menor duração e alta frequência com resposta imediata.

API híbrida: datalake e scraping em tempo real

A JUDIT é a única plataforma do mercado que oferece, por meio de uma mesma API jurídica, tanto a consulta direta a seu datalake jurídico proprietário quanto a busca em tempo real nos sistemas dos tribunais, inclusive em páginas protegidas por captcha. 

Por sua vez, essa combinação única permite entregar dados jurídicos em tempo real, garantindo não apenas atualizações contínuas e baixa latência, mas também cobertura mesmo em cenários de falhas nas fontes tradicionais. Esse modelo garante:

  • Baixa latência
  • Dados sempre atualizados
  • Cobertura completa mesmo em cenários de indisponibilidade dos fornecedores tradicionais

A arquitetura baseada em AWS permite gerenciar milhares de requisições concorrentes com segurança, elasticidade e desempenho. 

Próximos passos: IA jurídica, buscas inteligentes e modernização com Kubernetes

A infraestrutura da JUDIT continua evoluindo rapidamente, apoiada nos serviços da AWS para garantir robustez e flexibilidade. 

Os próximos passos da plataforma já estão em andamento:

  • Migração para Kubernetes: APIs, pipelines e serviços de monitoramento estão sendo gradualmente migrados para clusters gerenciados, com observabilidade em Grafana e Prometheus, otimizando o controle e o uso de recursos.
  • Amazon OpenSearch: substituirá as buscas diretas no MongoDB, permitindo consultas mais rápidas, complexas e personalizáveis. Será a base para novos produtos analíticos e insights jurídicos avançados.
  • Amazon Athena + Parquet no S3: com os dados já estruturados em Parquet, a JUDIT usará Athena inicialmente para análises internas e em breve para alimentar dashboards públicos com estatísticas jurídicas agregadas.
  • AWS Step Functions: os pipelines de curadoria e enriquecimento dos dados estão sendo orquestrados via Step Functions, permitindo a execução escalável e resiliente de tarefas como validação, categorização e normalização sem acoplamento.
  • Inteligência Artificial Jurídica com base em dados estruturados:
    Com o maior datalake jurídico estruturado do país e uma categorização semântica de milhões de processos, a JUDIT está construindo a fundação para se tornar o modelo de IA jurídica mais relevante do Brasil.

    O objetivo é ser uma fonte de dados para o treinamento de LLMs jurídicos e se tornar um parceiro estratégico da AWS no fornecimento de dados legais enriquecidos, prontos para alimentar soluções de IA generativa e análise preditiva.

Resultados concretos com uma equipe enxuta

A JUDIT atingiu resultados expressivos com uma equipe extremamente eficiente, graças à infraestrutura fornecida pela AWS:

  • +30 milhões de requisições mensais
  • 4 TB de dados jurídicos organizados
  • +100 clientes corporativos ativos

“A AWS nos permite fazer em 8 pessoas o que demandaria 3 times em qualquer outra arquitetura. Ela tira o peso da infraestrutura e nos dá liberdade para inovar com velocidade.”
Marco Rodrigues, Sócio e CTO da JUDIT

Rumo à liderança em dados jurídicos para IA

Com uma base sólida e resultados consistentes já comprovados, os próximos 12 meses da JUDIT serão focados em crescimento acelerado, ampliação da estrutura de dados e consolidação como referência em IA jurídica no Brasil.

Crescimento da base de clientes em 300%

A meta é aumentar significativamente a penetração em setores como bancos, fintechs, escritórios de advocacia e empresas de recuperação de crédito. Esse movimento se apoia no momento de adoção acelerada por parte de grandes players, que estão cada vez mais dispostos a incorporar dados jurídicos estruturados em suas operações.

Crescimento do volume de requisições em 500%

Historicamente, a média da JUDIT mostra que os clientes aumentam exponencialmente o volume de uso ao longo dos meses, à medida que integram novas squads e produtos. Por esse motivo, a arquitetura — baseada em serviços AWS — está totalmente preparada para absorver esse crescimento com elasticidade e resiliência, sem comprometer desempenho, segurança ou disponibilidade.

Finalização da categorização semântica e taxonômica dos dados

A JUDIT irá enriquecer todos os processos do datalake com metadados estruturados, como assuntos, classes, fases processuais e temporalidades. Com isso, a base estará pronta para consumo direto por modelos de linguagem jurídica (LLMs), garantindo interpretação semântica mais refinada e maior precisão analítica.

Preparação de datasets otimizados para IA

A JUDIT se posicionará como provedora oficial de dados jurídicos estruturados para Inteligência Artificial, com:

  • Dados em Parquet no S3, consultáveis via Athena e OpenSearch
  • Filtros precisos por entidade, tribunal, fase, resultado e mais
  • Documentação técnica clara, com schemas públicos e taxonomia padronizada

Desse modo, será possível entregar dados prontos para consumo por cientistas de dados, pesquisadores e plataformas de IA generativa.

Parcerias com iniciativas de IA da AWS

A JUDIT busca se consolidar como parceira estratégica da AWS, fornecendo dados jurídicos que alimentem:

  • Treinamento de modelos
  • Pesquisas acadêmicas
  • Soluções enterprise baseadas em IA generativa e preditiva

Assim, fortalece-se a posição da JUDIT como infraestrutura crítica para inovação jurídica no país.

Ampliar o datalake em 50%

A meta é encerrar o próximo ano com mais de 600 milhões de processos organizados, mantendo a atualização contínua, a padronização de campos e a integridade das informações.

Dessa forma, o datalake se tornará a maior base jurídica estruturada do país — pronta para escalar produtos baseados em dados.

Produtos prontos para consumo de dados via API e Athena

A JUDIT está desenvolvendo endpoints especializados para analistas de dados e cientistas jurídicos, permitindo:

  • Acesso exploratório via Athena
  • Consultas refinadas via OpenSearch
  • Consumo em tempo real e integração com ferramentas analíticas

Esses produtos permitirão exploração jurídica avançada com flexibilidade e autonomia.

Lançamento da base de entidades jurídicas com escore de risco processual

Por fim, a JUDIT lançará uma base com mapeamento completo de CPFs, CNPJs e advogados, considerando histórico processual, frequência de ações, tempo médio de tramitação e desfechos.

Esse recurso será essencial para:

  • Análise de risco
  • Prevenção à fraude
  • Tomada de decisão estratégica em tempo real

Dados jurídicos, inteligência e escala — com a AWS como aliada

A JUDIT nasceu na nuvem e, desde então, segue crescendo continuamente com a AWS como base de sustentação. Desde o início, essa escolha estratégica tem sustentado uma operação robusta, escalável e confiável. Graças a uma arquitetura moderna, segura e flexível, a empresa mantém o foco em seu plano de expansão, com uma visão clara e ambiciosa: tornar-se a principal infraestrutura de dados jurídicos do país.

Além disso, com a escalabilidade oferecida pela AWS, a JUDIT consegue processar milhões de processos, estruturar dados de forma confiável e treinar pipelines de categorização que serão, em breve, a base para modelos de linguagem jurídica e soluções preditivas. Isso significa que, mesmo diante do aumento constante na demanda, a empresa consegue sustentar seu crescimento sem perder eficiência.

Por esse motivo, a AWS não é apenas uma fornecedora de infraestrutura para a JUDIT — muito pelo contrário, é um parceiro estratégico essencial na jornada para revolucionar o acesso à Justiça por meio de dados estruturados e inteligência artificial aplicada.Para saber mais, acesse www.judit.io ou consulte a documentação técnica.

Quer saber como a Judit pode ajudar seu negócio?

Agende uma conversa com a gente!

Compartilhe o artigo

Quer saber como a Judit pode ajudar seu negócio?

Agende uma conversa com a gente!