# Resultado da Themis no OAB-Bench

> Documento de verificação gerado pela página /benchmark de peticaolegal.ai.
> Fonte do benchmark: OAB-Bench v2 (Maritaca AI) — https://huggingface.co/datasets/maritaca-ai/oab-bench

## Fonte do teste

OAB-Bench v2 · edições 39–44 · 7 áreas · 210 questões / 42 exames · juiz GPT-5.2 (modo estruturado). Conferido em 06/06/2026.

## Resultado geral da Themis

- Nota média: **8,74/10**
- Exames aprovados (≥ 6,0): **42/42**
- Posição geral: **3º entre 13 modelos**
- 1º entre as IAs jurídicas brasileiras

## Leaderboard geral (13 modelos)

| # | Modelo | Nota média (0–10) | Aprovação |
|--:|---|--:|:--:|
| 1 | Gemini 3.1 Pro | 9,39 | 42/42 |
| 2 | Claude Opus 4.6 | 8,82 | 42/42 |
| **3** | **Themis** | **8,74** | **42/42** |
| 4 | GPT-5.2 | 8,66 | 42/42 |
| 5 | Claude Sonnet 4.6 | 8,27 | 42/42 |
| 6 | Sabiá-4 | 7,96 | 42/42 |
| 7 | Gemini 3.1 Flash Lite | 7,60 | 39/42 |
| 8 | Sabiazinho-4 | 6,91 | 34/42 |
| 9 | Sabiá-3.1 | 6,91 | 35/42 |
| 10 | Qwen3.5-397B | 6,69 | 31/42 |
| 11 | GPT-5 mini | 6,52 | 31/42 |
| 12 | Qwen3.5-35B | 6,17 | 24/42 |
| 13 | Sabiazinho-3 | 6,12 | 26/42 |

## Desempenho da Themis por área

| Área | Nota (0–10) | Posição (entre 13) |
|---|--:|:--:|
| Civil | 9,19 | 2º |
| Administrativo | 9,13 | 2º |
| Trabalho | 9,12 | 3º |
| Penal | 8,89 | 4º |
| Constitucional | 8,39 | 4º |
| Tributário | 8,24 | 4º |
| Empresarial | 8,18 | 3º |

## Fato verificável — "1º entre as IAs jurídicas brasileiras"

A Themis supera todos os modelos da família Sabiá (Sabiá-4, Sabiazinho-4, Sabiá-3.1, Sabiazinho-3) em todas as 7 áreas e na nota geral.

## Nota metodológica

Resultado do OAB-Bench, benchmark independente que aplica provas reais da 2ª fase do Exame de Ordem (edições 39–44; 210 questões), com avaliação por modelo-juiz (GPT-5.2). Mede capacidade técnica de redação jurídica em ambiente de teste e não constitui aprovação oficial no Exame de Ordem nem garantia de resultado. A Themis é uma ferramenta de apoio à redação, sob revisão do advogado.

---

**Definições.** *Nota* = média das pontuações das questões (0–10). *Aprovação no benchmark* = exame com total ≥ 6,0. As notas referem-se exclusivamente ao desempenho no OAB-Bench e não representam aprovação no Exame de Ordem da OAB.
