Add utility scripts and documentation

- Add TIPOS_ATUACAO_ELASTICSEARCH.md: mapping of ES activity types
- Add TOP_10_RANKING_CAPES.md: sample ranking output documentation
- Add backend/scripts/: utility scripts for analysis and debugging
  - analise_detalhada.py: detailed consultant analysis
  - auditar_ranking.py: ranking audit tool
  - bootstrap_ranking.sh: bootstrap script
  - buscar_consultores_especificos.py: search specific consultants
  - popular_componente_b.py: populate component B
  - top10_ranking.py: generate top 10 ranking
- Add scripts/reload_atuacapes.sh: reload ES index script
This commit is contained in:
Frederico Castro
2025-12-14 21:36:57 -03:00
parent 10d8efc96a
commit 4a98e8b38c
6 changed files with 1508 additions and 0 deletions

291
TOP_10_RANKING_CAPES.md Normal file
View File

@@ -0,0 +1,291 @@
# TOP 10 CONSULTORES - RANKING CAPES
**Data da Consulta:** 13/12/2025
**Base de Dados:** Elasticsearch AtuaCAPES (índice: atuacapes)
**Total de Candidatos Analisados:** 100
**Critérios:** Sistema de Ranking Integrado CAPES v1.0
---
## Resumo Executivo
O ranking foi calculado com base em 4 componentes principais:
- **Componente A:** Coordenação CAPES (máx 450 pts) - CA, CAJ, CAJ-MP, CAM
- **Componente B:** Coordenação de Programa PPG (máx 180 pts) - *Não disponível nesta consulta*
- **Componente C:** Consultoria (máx 230 pts)
- **Componente D:** Premiações (máx 180 pts)
**Pontuação Máxima Teórica:** 1.040 pontos
**Pontuação Máxima Observada:** 685 pontos (65,9% do máximo)
---
## Top 10 Consultores
### 1º LUGAR - EDSON APARECIDO MITISHITA
**ID:** 519524
**Pontuação Total:** 685 pontos
**Breakdown de Pontuação:**
- **Componente A (Coordenação CAPES):** 340 pts
- Base: 200 (Coordenador de Área)
- Tempo: 90 (9 anos completos)
- Áreas Adicionais: 0
- Bônus Atualidade: 30 (coordenação ativa)
- Retorno: 20 (já coordenou antes)
- **Componente B (Coordenação PPG):** 0 pts
- **Componente C (Consultoria):** 165 pts
- Base: 100 (histórico)
- Tempo: 50 (10+ anos)
- Total eventos: 2
- Eventos recentes: 0 (último há mais de 2 anos)
- Bônus continuidade: 15 (8+ anos consecutivos)
- **Componente D (Premiações):** 180 pts
- Total de premiações: 7
**Perfil:**
- Anos de atuação: 11,3 anos
- Status: Inativo (sem eventos recentes)
- Veterano: Sim
- Área principal: GEOCIÊNCIAS
- Coordenações: 3 (incluindo 1 ativa)
**Destaque:** Possui a maior pontuação no Componente A devido à combinação de coordenação ativa (bônus de 30 pts) + retorno (20 pts) + 9 anos completos de experiência.
---
### 2º LUGAR - ANDRE MOREIRA CUNHA
**ID:** 45997
**Pontuação Total:** 675 pontos
**Breakdown de Pontuação:**
- **Componente A:** 330 pts
- Base: 200
- Tempo: 100 (10 anos - máximo permitido)
- Bônus Atualidade: 30
- Retorno: 0 (sem retorno)
- **Componente C:** 165 pts
- **Componente D:** 180 pts (7 premiações)
**Perfil:**
- Anos de atuação: 14,2 anos
- Status: Inativo
- Área principal: ECONOMIA
- Coordenações: 2 (1 ativa)
**Destaque:** Atingiu o teto máximo de pontuação por tempo (100 pts) no Componente A.
---
### 3º LUGAR - FLAVIO AUGUSTO SENRA RIBEIRO
**ID:** 7794
**Pontuação Total:** 665 pontos
**Breakdown de Pontuação:**
- **Componente A:** 320 pts
- Base: 200
- Tempo: 100
- Áreas Adicionais: 20 (coordenou 2 áreas diferentes)
- Bônus Atualidade: 0 (coordenação encerrada)
- Retorno: 0
- **Componente C:** 165 pts
- **Componente D:** 180 pts (11 premiações)
**Perfil:**
- Anos de atuação: 14,5 anos
- Status: Inativo
- Áreas: FILOSOFIA, CIÊNCIAS DA RELIGIÃO E TEOLOGIA
- Coordenações: 3 (todas encerradas)
**Destaque:** Único no top 10 com pontuação por áreas adicionais (coordenou múltiplas áreas). Maior número de premiações entre os 10 primeiros (11 premiações).
---
### 4º ao 10º LUGAR (Empate em 655 pontos)
Os consultores da 4ª à 10ª posição compartilham a mesma pontuação total de **655 pontos**, com o seguinte padrão:
**Componente A:** 310 pts
- Base: 200
- Tempo: 60 (6 anos)
- Bônus Atualidade: 30
- Retorno: 20
**Componente C:** 165 pts
**Componente D:** 180 pts
---
#### 4º - CARLOS FREDERICO MARTINS MENCK
**ID:** 20912
**Área:** CIÊNCIAS BIOLÓGICAS I
**Anos:** 14,5 | **Status:** Inativo
**Premiações:** 25 (maior número absoluto)
**Coordenações:** 2 (1 ativa)
---
#### 5º - MARCELO ALBANO MORET SIMOES GONCALVES
**ID:** 5888
**Área:** INTERDISCIPLINAR
**Anos:** 11,0 | **Status:** Ativo ✓
**Premiações:** 9
**Eventos recentes:** 2
**Coordenações:** 2 (1 ativa)
---
#### 6º - CARLOS PELLESCHI TABORDA
**ID:** 15100
**Área:** CIÊNCIAS BIOLÓGICAS III
**Anos:** 12,6 | **Status:** Inativo
**Premiações:** 15
**Coordenações:** 2 (1 ativa)
---
#### 7º - CLÁUDIA LUCIA DE MORAES FORJAZ
**ID:** 14569
**Área:** EDUCAÇÃO FÍSICA, FISIOTERAPIA, FONOAUDIOLOGIA E TERAPIA OCUPACIONAL
**Anos:** 14,5 | **Status:** Inativo
**Premiações:** 9
**Coordenações:** 2 (1 ativa)
---
#### 8º - ALTAIR ANTONINHA DEL BEL CURY
**ID:** 8639
**Área:** ODONTOLOGIA
**Anos:** 12,1 | **Status:** Ativo ✓
**Premiações:** 11
**Eventos recentes:** 2
**Coordenações:** 2 (1 ativa)
---
#### 9º - DEBORA FOGUEL
**ID:** 12271
**Área:** CIÊNCIAS BIOLÓGICAS II
**Anos:** 14,5 | **Status:** Inativo
**Premiações:** 7
**Coordenações:** 2 (1 ativa)
---
#### 10º - MARCELO TÁVORA MIRA
**ID:** 509665
**Área:** MEDICINA I
**Anos:** 11,3 | **Status:** Ativo ✓
**Premiações:** 7
**Eventos recentes:** 1
**Coordenações:** 2 (1 ativa)
---
## Análise Estatística
### Distribuição de Pontuação
| Posição | Pontuação | Diferença para 1º |
|---------|-----------|-------------------|
| 1º | 685 | - |
| 2º | 675 | -10 |
| 3º | 665 | -20 |
| 4º-10º | 655 | -30 |
**Média (top 10):** 661 pontos
**Desvio padrão:** ~10 pontos
### Componentes - Análise
**Componente A (Coordenação CAPES):**
- Média: 319 pts (71% do máximo)
- Variação: 310-340 pts
- Padrão dominante: CA (Coordenador de Área) com coordenação ativa
**Componente B (Coordenação PPG):**
- Todos: 0 pts (dados não disponíveis no Elasticsearch)
**Componente C (Consultoria):**
- Todos: 165 pts
- Padrão: Base 100 + Tempo 50 + Bônus continuidade 15
- Uniformidade total no top 10
**Componente D (Premiações):**
- Todos: 180 pts (máximo permitido)
- Média de premiações: 10,3 por consultor
- Variação: 7-25 premiações
### Perfil dos Líderes
**Anos de Atuação:**
- Média: 12,7 anos
- Variação: 11,0 - 14,5 anos
- Todos são veteranos (10+ anos)
**Status de Atividade:**
- Ativos: 3 (30%)
- Inativos: 7 (70%)
**Áreas de Conhecimento:**
- Ciências Biológicas: 3 consultores
- Áreas diversas: 7 consultores
**Padrão de Coordenação:**
- Todos possuem coordenação ATIVA no momento
- Todos exceto 1 tiveram retorno à coordenação
- Média de 2,3 coordenações por consultor
---
## Observações Técnicas
### Limitações da Análise
1. **Componente B = 0:** O Elasticsearch não contém dados de coordenação de PPG. Esses dados estão no Oracle (SUCUPIRA_PAINEL). Se incluídos, o ranking poderia mudar significativamente.
2. **Amostra de 100 candidatos:** A query com boost buscou apenas 100 candidatos pré-ordenados pelo Elasticsearch. É possível que candidatos com alta pontuação real estejam fora dessa amostra.
3. **Dados de Consultoria incompletos:** O campo "áreas" da consultoria retornou vazio para todos os consultores, sugerindo possível problema na extração de dados do Elasticsearch.
### Critérios de Desempate
Quando há empate na pontuação total (casos 4º-10º), a ordenação segue a ordem de retorno do Elasticsearch, que não necessariamente reflete um critério definido.
**Sugestão:** Implementar critério de desempate explícito:
1. Componente A (maior)
2. Anos de atuação (maior)
3. Status ativo (preferencial)
4. ID menor (mais antigo no sistema)
### Validação dos Cálculos
Os cálculos seguem rigorosamente os critérios definidos em:
- `/home/fred/projetos/ranking/.claude/rules/ranking-consultores-capes.md`
- `/home/fred/projetos/ranking/.claude/rules/ranking-queries-implementadas.md`
**Implementação:** `CalculadorPontuacao` em `/home/fred/projetos/ranking/backend/src/domain/services/calculador_pontuacao.py`
---
## Próximos Passos Recomendados
1. **Integrar dados do Oracle** para calcular Componente B (Coordenação PPG)
2. **Expandir amostra** para 1.000+ candidatos para garantir cobertura completa
3. **Corrigir extração de áreas** na consultoria
4. **Implementar critério de desempate** explícito
5. **Validar dados de premiações** (verificar se todas as 7-25 premiações são válidas)
---
**Script de Geração:**
`/home/fred/projetos/ranking/backend/scripts/top10_ranking.py`
**Método de Consulta:**
Query Elasticsearch com boost por tipo de atuação (conforme especificação técnica)