A IA jurídica brasileira de melhor desempenho no OAB-Bench
Avaliada de forma independente em 210 questões reais da 2ª fase do Exame de Ordem, a Themis obteve nota de aprovação em todos os 42 exames do benchmark e superou modelos generalistas como o GPT-5.2, ficando em 3º lugar entre 13 IAs avaliadas. Toda peça sai sob a revisão do advogado.
8,74/10
Nota média no benchmark
42/42
Exames com nota de aprovação (≥ 6,0)
3º / 13
Entre os modelos de IA avaliados
1º
Entre as IAs jurídicas brasileiras, nas 7 áreas
O que esse resultado diz (e o que não diz)
O OAB-Bench mede a capacidade técnica de uma IA redigir peças e respostas fundamentadas, nas 7 áreas da 2ª fase do Exame de Ordem, avaliada por um modelo-juiz independente. Uma nota alta indica redação consistente e bem embasada em condições de teste.
Para quem advoga sozinho, isso é tempo de volta no seu dia. A Themis assume o trabalho pesado (leitura dos autos, pesquisa de jurisprudência e a primeira redação) e devolve uma peça pronta para revisão em minutos, não horas. É mais casos com a mesma qualidade, sem aumentar a equipe.
Quanto isso economiza, na prática
Cerca de 70% da jornada de um advogado contencioso vai em pesquisa e redação, exatamente o que a Themis acelera. Veja um caso real, ponta a ponta:
Sozinho
≈ 12 h
Com a Themis
≈ 2 h
Você economiza
≈ 83%
~10 h por caso
| Etapa | Sozinho | Com a Themis |
|---|---|---|
| Ler e analisar os documentos do caso | 3 h | Minutos: ingestão automática dos 9 arquivos |
| Diagnóstico e estratégia | 2 h | Minutos: análise automática do caso |
| Pesquisa de jurisprudência e doutrina | 3 h | Minutos: RAG com fontes rastreáveis |
| Redação da peça (~1.700 palavras) | 3 h | Minutos: peça completa, pronta para revisão |
| Revisão, ajuste e protocolo | 1 h | ~1,5 h: revisão humana (sempre necessária) |
Estimativa: baseada em um caso real (9 documentos, 29 páginas; peça final de ~1.700 palavras) e em premissas de tempo declaradas. Com a Themis, o tempo se concentra na revisão humana, sempre necessária; os tempos variam conforme o caso.
É um indicador de capacidade, não uma aprovação oficial no Exame de Ordem nem garantia de resultado. Toda peça exige a revisão de um advogado, e a decisão final é sempre sua.
Forte onde você trabalha
A Themis foi avaliada nas 7 áreas do Direito, em 6 edições do exame (39 a 44).
O Themis é uma IA muito forte em:
Civil
2º lugar entre 13 modelos
Administrativo
2º lugar entre 13 modelos
Trabalho
3º lugar entre 13 modelos
| Área | Nota (0–10) | Posição |
|---|---|---|
| Civil | 9,19 | 2º |
| Administrativo | 9,13 | 2º |
| Trabalho | 9,12 | 3º |
| Penal | 8,89 | 4º |
| Constitucional | 8,39 | 4º |
| Tributário | 8,24 | 4º |
| Empresarial | 8,18 | 3º |
O quadro completo, sem recorte
Mostramos o ranking inteiro, inclusive os dois modelos à frente da Themis. Entre as IAs jurídicas brasileiras, a Themis lidera; e supera modelos generalistas de grande porte como o GPT-5.2 e o Claude Sonnet 4.6.
| # | Modelo | Nota média | Aprovação |
|---|---|---|---|
| 1 | Gemini 3.1 Pro | 9,39 | 42/42 |
| 2 | Claude Opus 4.6 | 8,82 | 42/42 |
| 3 | ThemisNossa IA | 8,74 | 42/42 |
| 4 | GPT-5.2 | 8,66 | 42/42 |
| 5 | Claude Sonnet 4.6 | 8,27 | 42/42 |
| 6 | Sabiá-4 | 7,96 | 42/42 |
| 7 | Gemini 3.1 Flash Lite | 7,60 | 39/42 |
| 8 | Sabiazinho-4 | 6,91 | 34/42 |
| 9 | Sabiá-3.1 | 6,91 | 35/42 |
| 10 | Qwen3.5-397B | 6,69 | 31/42 |
| 11 | GPT-5 mini | 6,52 | 31/42 |
| 12 | Qwen3.5-35B | 6,17 | 24/42 |
| 13 | Sabiazinho-3 | 6,12 | 26/42 |
Como o teste foi feito
O OAB-Bench é um benchmark independente que aplica questões reais da 2ª fase do Exame de Ordem (edições 39 a 44), no total de 210 questões: 42 peças processuais e 168 questões discursivas, cobrindo as 7 áreas do Direito.
Cada resposta da Themis foi avaliada por um modelo-juiz independente (GPT-5.2), em modo estruturado, com o mesmo critério aplicado a todos os modelos do ranking. Isso torna a comparação direta e o resultado reprodutível e auditável.
Nota metodológica
Resultado do OAB-Bench, benchmark independente que aplica provas reais da 2ª fase do Exame de Ordem (edições 39–44; 210 questões), com avaliação por modelo-juiz (GPT-5.2). Mede capacidade técnica de redação jurídica em ambiente de teste e não constitui aprovação oficial no Exame de Ordem nem garantia de resultado. A Themis é uma ferramenta de apoio à redação, sob revisão do advogado.
Dados e julgamentos disponíveis para auditoria mediante solicitação. Fale com a gente.
Não é um chat genérico
A Themis é especializada em Direito brasileiro e trabalha em etapas, como você trabalharia: primeiro diagnóstico e estratégia, depois a redação da peça completa. A fundamentação é construída sobre um acervo de legislação, jurisprudência e doutrina, com as fontes sinalizadas no texto.
O resultado é um material para você revisar e assinar. A Themis potencializa o seu trabalho, não substitui o seu julgamento.
Etapa 1
Diagnóstico e estratégia
A Themis lê o caso, identifica a tese e monta a estratégia antes de escrever.
Etapa 2
Redação fundamentada
Redige a peça completa citando legislação, jurisprudência e doutrina, com as fontes sinalizadas.
Etapa 3
Sua revisão
Você revisa, ajusta e assina. A Themis potencializa o seu trabalho, não substitui o seu julgamento.
Definições. Nota = média das pontuações das questões (0–10). Aprovação no benchmark = exame com total ≥ 6,0. As notas referem-se exclusivamente ao desempenho no OAB-Bench e não representam aprovação no Exame de Ordem da OAB.
Resultado do OAB-Bench, benchmark independente que aplica provas reais da 2ª fase do Exame de Ordem (edições 39–44; 210 questões), com avaliação por modelo-juiz (GPT-5.2). Mede capacidade técnica de redação jurídica em ambiente de teste e não constitui aprovação oficial no Exame de Ordem nem garantia de resultado. A Themis é uma ferramenta de apoio à redação, sob revisão do advogado.