OAB-Bench · 2ª fase

A IA jurídica brasileira de melhor desempenho no OAB-Bench

Avaliada de forma independente em 210 questões reais da 2ª fase do Exame de Ordem, a Themis obteve nota de aprovação em todos os 42 exames do benchmark e superou modelos generalistas como o GPT-5.2, ficando em 3º lugar entre 13 IAs avaliadas. Toda peça sai sob a revisão do advogado.

Testar a Themis Ver a metodologia

8,74/10

Nota média no benchmark

42/42

Exames com nota de aprovação (≥ 6,0)

3º / 13

Entre os modelos de IA avaliados

1º

Entre as IAs jurídicas brasileiras, nas 7 áreas

O que esse resultado diz (e o que não diz)

O OAB-Bench mede a capacidade técnica de uma IA redigir peças e respostas fundamentadas, nas 7 áreas da 2ª fase do Exame de Ordem, avaliada por um modelo-juiz independente. Uma nota alta indica redação consistente e bem embasada em condições de teste.

Para quem advoga sozinho, isso é tempo de volta no seu dia. A Themis assume o trabalho pesado (leitura dos autos, pesquisa de jurisprudência e a primeira redação) e devolve uma peça pronta para revisão em minutos, não horas. É mais casos com a mesma qualidade, sem aumentar a equipe.

Quanto isso economiza, na prática

Cerca de 70% da jornada de um advogado contencioso vai em pesquisa e redação, exatamente o que a Themis acelera. Veja um caso real, ponta a ponta:

Sozinho

≈ 12 h

Com a Themis

≈ 2 h

Você economiza

≈ 83%

~10 h por caso

Tempo por etapa do processo: sozinho vs com a Themis.
Etapa	Sozinho	Com a Themis
Ler e analisar os documentos do caso	3 h	Minutos: ingestão automática dos 9 arquivos
Diagnóstico e estratégia	2 h	Minutos: análise automática do caso
Pesquisa de jurisprudência e doutrina	3 h	Minutos: RAG com fontes rastreáveis
Redação da peça (~1.700 palavras)	3 h	Minutos: peça completa, pronta para revisão
Revisão, ajuste e protocolo	1 h	~1,5 h: revisão humana (sempre necessária)

Estimativa: baseada em um caso real (9 documentos, 29 páginas; peça final de ~1.700 palavras) e em premissas de tempo declaradas. Com a Themis, o tempo se concentra na revisão humana, sempre necessária; os tempos variam conforme o caso.

É um indicador de capacidade, não uma aprovação oficial no Exame de Ordem nem garantia de resultado. Toda peça exige a revisão de um advogado, e a decisão final é sempre sua.

Forte onde você trabalha

A Themis foi avaliada nas 7 áreas do Direito, em 6 edições do exame (39 a 44).

O Themis é uma IA muito forte em:

Civil

9,19/ 10

2º lugar entre 13 modelos

Administrativo

9,13/ 10

2º lugar entre 13 modelos

Trabalho

9,12/ 10

3º lugar entre 13 modelos

Nota e posição da Themis por área do Direito no OAB-Bench, entre 13 modelos.
Área	Nota (0–10)	Posição
Civil	9,19	2º
Administrativo	9,13	2º
Trabalho	9,12	3º
Penal	8,89	4º
Constitucional	8,39	4º
Tributário	8,24	4º
Empresarial	8,18	3º

O quadro completo, sem recorte

Mostramos o ranking inteiro, inclusive os dois modelos à frente da Themis. Entre as IAs jurídicas brasileiras, a Themis lidera; e supera modelos generalistas de grande porte como o GPT-5.2 e o Claude Sonnet 4.6.

Leaderboard geral do OAB-Bench: 13 modelos por nota média e aprovação.
#	Modelo	Nota média	Aprovação
1	Gemini 3.1 Pro	9,39	42/42
2	Claude Opus 4.6	8,82	42/42
3	ThemisNossa IA	8,74	42/42
4	GPT-5.2	8,66	42/42
5	Claude Sonnet 4.6	8,27	42/42
6	Sabiá-4	7,96	42/42
7	Gemini 3.1 Flash Lite	7,60	39/42
8	Sabiazinho-4	6,91	34/42
9	Sabiá-3.1	6,91	35/42
10	Qwen3.5-397B	6,69	31/42
11	GPT-5 mini	6,52	31/42
12	Qwen3.5-35B	6,17	24/42
13	Sabiazinho-3	6,12	26/42

Como o teste foi feito

O OAB-Bench é um benchmark independente que aplica questões reais da 2ª fase do Exame de Ordem (edições 39 a 44), no total de 210 questões: 42 peças processuais e 168 questões discursivas, cobrindo as 7 áreas do Direito.

Cada resposta da Themis foi avaliada por um modelo-juiz independente (GPT-5.2), em modo estruturado, com o mesmo critério aplicado a todos os modelos do ranking. Isso torna a comparação direta e o resultado reprodutível e auditável.

Ver a fonte do teste (OAB-Bench · Maritaca AI)Baixar o resultado completo (.md)

Nota metodológica

Resultado do OAB-Bench, benchmark independente que aplica provas reais da 2ª fase do Exame de Ordem (edições 39–44; 210 questões), com avaliação por modelo-juiz (GPT-5.2). Mede capacidade técnica de redação jurídica em ambiente de teste e não constitui aprovação oficial no Exame de Ordem nem garantia de resultado. A Themis é uma ferramenta de apoio à redação, sob revisão do advogado.

Dados e julgamentos disponíveis para auditoria mediante solicitação. Fale com a gente.

Não é um chat genérico

A Themis é especializada em Direito brasileiro e trabalha em etapas, como você trabalharia: primeiro diagnóstico e estratégia, depois a redação da peça completa. A fundamentação é construída sobre um acervo de legislação, jurisprudência e doutrina, com as fontes sinalizadas no texto.

O resultado é um material para você revisar e assinar. A Themis potencializa o seu trabalho, não substitui o seu julgamento.

Etapa 1
Diagnóstico e estratégia
A Themis lê o caso, identifica a tese e monta a estratégia antes de escrever.
Etapa 2
Redação fundamentada
Redige a peça completa citando legislação, jurisprudência e doutrina, com as fontes sinalizadas.
Etapa 3
Sua revisão
Você revisa, ajusta e assina. A Themis potencializa o seu trabalho, não substitui o seu julgamento.

Comece a redigir com uma base sólida

Crie sua conta e teste a Themis hoje.

Testar a Themis

Definições. Nota = média das pontuações das questões (0–10). Aprovação no benchmark = exame com total ≥ 6,0. As notas referem-se exclusivamente ao desempenho no OAB-Bench e não representam aprovação no Exame de Ordem da OAB.

Resultado do OAB-Bench, benchmark independente que aplica provas reais da 2ª fase do Exame de Ordem (edições 39–44; 210 questões), com avaliação por modelo-juiz (GPT-5.2). Mede capacidade técnica de redação jurídica em ambiente de teste e não constitui aprovação oficial no Exame de Ordem nem garantia de resultado. A Themis é uma ferramenta de apoio à redação, sob revisão do advogado.