Daniel, vejo que a enterprise Code Aura se especializa em:
- Documentação por IA para sistemas legados/mainframe (incluindo COBOL e JCL)
- promessa de reduzir dependência de especialistas raros (SMEs) via automação
Você está lá há pouco tempo e não sei se você ajuda a escrever os pacotes que ela vende, simplesmente adaptando para eventuais clientes.
Por curiosidade e imaginando o que você deve andar fazendo, sem pensar na redução da dependência de especialistas raros, apenas pensando na documentação, o que o Chat GPT me informa é o seguinte:
O que “boa documentação” precisa gerar
1) Documentação por programa (COBOL)
Para cada programa:
- Propósito (1–3 frases)
- Entradas e saídas (arquivos VSAM/sequenciais, DB2 tables, CICS commarea, telas)
- Regras de negócio principais (bullets “se… então…”, com campos envolvidos)
- Exceções/erros (códigos, condições)
- Dependências (CALLs, copybooks, SQL, arquivos)
2) Documentação por job (JCL)
Para cada JOB:
- o fluxo (steps na ordem, o que cada step faz)
- datasets (inputs/outputs; criação, catálogo, GDG)
- pontos de controle/restart
- janelas e dependências (pré-requisitos e pós-processos)
3) Visões “de sistema” (para humanos)
- Mapa de dependências (call graph e job flow)
- Data lineage (de onde vem e para onde vai cada dado importante)
- Glossário de campos (nomes “humanos” + origem; copybooks; colunas)
Como a IA entra
O que funciona melhor é híbrido:
- Análise estática para dependências reais (CALL, SQL, JCL datasets)
- IA para escrever em linguagem humana e organizar regras
Se for só IA “lendo texto”, ela costuma errar dependências.
Como avaliar rapidamente uma ferramenta (checklist de 30 minutos)
Pegue um conjunto pequeno:
- 5 programas COBOL “core”
- 1 ou 2 JOBs JCL críticos
- copybooks relacionados
- um ou dois módulos com SQL
E teste:
- Ela identifica dependências reais? (CALLs, copybooks, tabelas)
- Ela não inventa? (alucinação é o maior risco)
- Ela consegue apontar campos (nomes de copybook/coluna) ao explicar uma regra?
- Ela gera doc reproduzível (se o código mudar, atualiza a doc)?
- Ela permite “evidência” (links/trechos do código que suportam cada afirmação)?
Se não houver “evidência rastreável”, a doc vira bonita… e perigosa.
Um formato de saída que costuma dar certo (para wiki)
- Página por programa: Resumo / I/O / Regras / Dependências / Exceções
- Página por JOB: Fluxo / Steps / Datasets / Restart / Dependências
- Páginas transversais: Glossário / Arquivos / Tabelas / Diagramas
Minha colaboração para esta sua nova encarnação
Roque
PS Você acertou em cheio na escolha, veja porque