Exemplo de normalização
Para exemplificar o processo de normalização, vamos considerar a base de dados de egressos da Universidade Federal do Rio Grande do Norte (UFRN), publicizada no Portal de Dados Abertos do Governo Federal 0. O órgão disponibilizou o seguinte dicionário de dados 1:
| Campo | Tipo | Descrição | Obrigatório? |
|---|---|---|---|
| matricula | Inteiro | Matrícula do discente. | Sim |
| nome_discente | Texto | Nome do discente. | Sim |
| sexo | Texto | Sexo do discente. | Não |
| ano_conclusao | Inteiro | Ano em que o discente concluiu | Sim |
| periodo_conclusao | Inteiro | Período em que o discente concluiu | Sim |
| ano_ingresso | Inteiro | Ano de ingresso na instituição. | Sim |
| periodo_ingresso | Inteiro | Período de ingresso na instituição. | Sim |
| forma_ingresso | Texto | Forma de ingresso na universidade. | Sim |
| tipo_discente | Texto | Tipo de discente (regular ou especial). | Sim |
| nivel_ensino | Texto | Nível de ensino do discente. | Sim |
| id_curso | Texto | Identificador do curso do discente. | Sim |
| nome_curso | Texto | Nome do curso do discente. | Sim |
| modalidade_educacao | Texto | Modalidade de educação do curso do discente. | Sim |
| id_unidade | Inteiro | Identificador da unidade do curso do discente. | Sim |
| nome_unidade | Texto | Unidade do curso do discente. | Sim |
| id_unidade_gestora | Inteiro | Identificador da unidade gestora do curso do discente. | Sim |
| nome_unidade_gestora | Texto | Unidade gestora do curso do discente | Sim |
| Para o processo de aplicação das formas normais, foi considerada a base de 2006 2. Buscando tornar o processo mais simples, apresento aqui alguns registros que integram essa base: |
| matricula | nome_discente | sexo | ano_conclusao | periodo_conclusao | ano_ingresso | periodo_ingresso | id_curso | nome_curso | modalidade_educacao | forma_ingresso | tipo_discente | nivel_ensino | id_unidade | nome_unidade | id_unidade_gestora | nome_unidade_gestora |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 198410658 | NOME DO DISCENTE 1 | M | 2006 | 2 | 1984 | 1 | 2000011 | CIÊNCIAS CONTÁBEIS | PRESENCIAL | VESTIBULAR | REGULAR | GRADUAÇÃO | 443 | CENTRO DE CIÊNCIAS SOCIAIS APLICADAS | 443 | CENTRO DE CIÊNCIAS SOCIAIS APLICADAS |
| 198502340 | NOME DO DISCENTE 2 | M | 2006 | 1 | 1988 | 1 | 2000031 | ENGENHARIA MECÂNICA | PRESENCIAL | REOPCAO | REGULAR | GRADUAÇÃO | 445 | CENTRO DE TECNOLOGIA | 445 | CENTRO DE TECNOLOGIA |
| 198524203 | NOME DO DISCENTE 3 | F | 2006 | 1 | 1996 | 1 | 2000039 | FARMÁCIA | PRESENCIAL | PORTADOR DE DIPLOMA | REGULAR | GRADUAÇÃO | 441 | CENTRO DE CIÊNCIAS DA SAÚDE | 441 | CENTRO DE CIÊNCIAS DA SAÚDE |
| 199837434 | NOME DO DISCENTE 4 | F | 2006 | 1 | 1998 | 1 | 2000004 | ADMINISTRAÇÃO | PRESENCIAL | VESTIBULAR | REGULAR | GRADUAÇÃO | 31011 | FACULDADE DE ENGENHARIA, LETRAS E CIÊNCIAS SOCIAIS DO SERIDÓ - FELCS | 605 | UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE |
| 198906149 | NOME DO DISCENTE 5 | M | 2006 | 1 | 1990 | 1 | 111635041 | EDUCAÇÃO FÍSICA | PRESENCIAL | TRANSF. COMPULSORIA | REGULAR | GRADUAÇÃO | 441 | CENTRO DE CIÊNCIAS DA SAÚDE | 441 | CENTRO DE CIÊNCIAS DA SAÚDE |
| 200697544 | NOME DO DISCENTE 6 | F | 2006 | 2 | 2006 | 1 | 315774 | DOUTORADO EM CIÊNCIAS DA SAÚDE | PRESENCIAL | REGULAR | DOUTORADO | 66 | PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS DA SAÚDE | 441 | CENTRO DE CIÊNCIAS DA SAÚDE |
Primeira Forma Normal (1FN)
Ao analisarmos a base de dados, considerando o estado da relação, podemos concluir que a relação já está na 1FN, porque:
- possui chave candidata (o atributo ) que identifica univocamente as tuplas da relação;
- todos os atributos são atômicos;
Segunda Forma Normal (2FN)
Se fôssemos considerar a definição simples da 2FN, que analisa apenas casos em que os atributos não principais (não primos) devem possuir dependência funcional total da chave primária (composta), poderíamos concluir que a relação está na 2FN, já que possui apenas chave primária simples.
Para verificarmos a aplicabilidade da definição restritiva da 2FN, precisamos identificar primeiro quais são as chaves candidatas para a relação . Durante o estudo de viabilidade da , já identificamos que o atributo é chave candidata.
Ao analisarmos o dicionário de dados desta relação, podemos observar que esta é a única chave candidata para a relação. Embora até possamos propor outras chaves candidatas (neste caso compostas), ainda assim elas não seriam capazes de identificar univocamente as tuplas, considerando-se o cenário real, em que podemos ter estudantes homônimos.
Assim, concluímos que essa relação atende a 2FN.
Terceira Forma Normal (3FN)
Definição simples
Para analisar o cumprimento da 3FN por esta relação, precisamos começar identificando quais são as dependências funcionais transitivas () com relação à chave primeira (definição simples da 3FN).
Logo, segundo a definição simples, esta relação não está normalizada, pois possui atributos não-principais dependentes transitivamente da chave primária. Para normalizar, adotaríamos a seguinte abordagem:
undefined