Criptografia Numaboa
Exemplo de criptoanálise para iniciantes
Ter 27 Jan 2009 19:57 |
- Detalhes
- Categoria: Criptoanálise
- Atualização: Segunda, 03 Agosto 2009 21:24
- Autor: vovó Vicki
- Acessos: 11318
Neste exemplo de criptoanálise para iniciantes não vou começar o texto entregando o ouro. Siga a rotina de trabalho e descubra no final o sistema e a chave que foram empregados para cifrar a mensagem. Veja como é possível obter o texto original da mensagem.
A mensagem cifrada
V RMHFURXRVMGV MLH KILGVTVI XLN OVRH KIVXRHZNLH MLH KILGVTVI XLN NZGVNZGRXZ
Como é um exemplo para iniciantes, os espaços entre as palavras foram conservados.
Uma dica: letras acentuadas e letras especiais (como ç) foram substituídas pelas letras originais do alfabeto.
Outra dica: a mensagem está em português.
Primeiro contato
- A mensagem cifrada é composta por 11 grupos de letras (11 palavras?), num total de 65 letras.
- Note que há um grupo de letras que ocorre em duplicidade: MLH KILGVTVI XLN.
- A primeira letra do criptograma (V) pode ser O, A, E, É...
- Os grupos MLH e XLN podem ser coisa do tipo QUE, NÃO, COM, etc.
- Fazendo um pouco de ordem:
POSIÇÃO | 1 | 2 | 3 | 4 | 5 |
Mensagem Cifrada | V | RMHFURXRVMGV | MLH | KILGVTVI | XLN |
POSIÇÃO | 6 | 7 | 8 | 9 | 10 |
Mensagem Cifrada | OVRH | KIVXRHZNLH | MLH | KILGVTVI | XLN |
POSIÇÃO | 11 | ||||
Mensagem Cifrada | NZGVNZGRXZ |
Tabela de Frequência
Letra | Ocorrências | Porcentagem | |
F | 1 | 1.54 % | |
G | 5 | 7.69 % | |
H | 6 | 9.23 % | |
I | 5 | 7.69 % | |
K | 3 | 4.62 % | |
L | 7 | 10.77 % | |
M | 4 | 6.15 % | |
N | 5 | 7.69 % | |
O | 1 | 1.54 % | |
R | 6 | 9.23 % | |
T | 2 | 3.08 % | |
U | 1 | 1.54 % | |
V | 10 | 15.39 % | |
X | 5 | 7.69 % | |
Z | 4 | 6.15 % | |
TOTAL | 65 | 100.00 % |
Foi utilizado o programa 'Frequência NumaBoa' para obter a distribuição da frequência e os histogramas da mensagem cifrada. Se você tiver interesse, o programa está disponível na seção de downloads da Aldeia em [Downloads / Criptologia / Criptoanálise]
Determinação da Classe da Cifra
As cifras podem ser de transposição ou de substituição. A primeira tarefa é tentar identificar a classe à qual a mensagem cifrada pertence. Um dos métodos de determinação de classe é a comparação da frequência de ocorrência de vogais e consoantes, as últimas de acordo com o nível de frequência (alto, médio, baixo). É importante observar principalmente as consoantes de frequência baixa.
Quanto maior o desvio dos valores encontrados em relação aos valores esperados, tanto maior a probabilidade de se tratar de uma cifra de substituição.
TIPOS | LETRAS | ESPERADO | ENCONTRADO (em 65 letras) |
ENCONTRADO (em 100 letras) |
Vogais | AEIOU | 48-49 | 7 | 11 |
Consoantes de Alta Frequência | CDMNRST | 37 | 17 | 26 |
Consoantes de Frequência Média | BGHFLPQV | 12-13 | 29 | 45 |
Consoantes de Baixa Frequência | JKWXYZ | 1 | 12 | 18 |
Total | 100 | 65 | 100 |
A distribuição encontrada por grupo de frequência mostra grandes desvios em relação aos valores esperados. Tudo indica tratar-se de uma cifra de substituição e, se for realmente uma cifra de substituição, é preciso determinar se é uma substituição monoalfabética ou polialfabética.
A Distribuição de Frequência Uniliteral - DFU
A análise da distribuição de frequência uniliteral - DFU permite determinar se a mensagem cifrada por substituição é mono ou polialfabética. Comparam-se as cristas e vales das frequências encontradas com o perfil das frequências esperadas.
As características da língua portuguesa podem ser vistas em maiores detalhes em Frequência da ocorrência de letras no Português.
Apesar das cristas e vales não coinciderem nas duas amostras, verifica-se que ainda são muito marcadas nas letras encontradas. Além disto, chama a atenção que o grupo formado pelas frequências esperadas das letras de L a V (à esquerda) é muito semelhante ao grupo formado pelas frequências econtradas (à direita) das letras F a O.
Mesmo deslocando um gráfico em relação ao outro, parece difícil encontrar uma coincidência de padrão de distribuição. Mas veja o que acontece quando invertemos um dos gráficos (o gráfico da distribuição esperada):
A distribuição das frequências torna-se bastante próxima. Considerando que a mensagem cifrada possui apenas 65 letras, o que aumenta em muito a chance de desvios acentuados, o desvio encontrado é bastante discreto.
Até o momento, tudo indica tratar-se de uma mensagem cifrada por substituição monoalfabética com deslocamento de 26 posições. Se é que você se lembra, parece ser o mesmo padrão do Atbash!
Decifrando a mensagem
A | B | C | D | E | F | G | H | I | J | K | L | M |
Z | Y | X | W | V | U | T | S | R | Q | P | O | N |
POSIÇÃO | 1 | 2 | 3 | 4 | 5 |
Mensagem Cifrada | V | RMHFURXRVMGV | MLH | KILGVTVI | XLN |
Mensagem Original | e | insuficiente | nos | proteger | com |
POSIÇÃO | 6 | 7 | 8 | 9 | 10 |
Mensagem Cifrada | OVRH | KIVXRHZNLH | MLH | KILGVTVI | XLN |
Mensagem Original | leis | precisamos | nos | proteger | com |
POSIÇÃO | 11 | ||||
Mensagem Cifrada | NZGVNZGRXZ | ||||
Mensagem Original | matematica |
É INSUFICIENTE NOS PROTEGER COM LEIS. PRECISAMOS NOS PROTEGER COM MATEMÁTICA.
Frase de Bruce Schneier, autor de algoritmos de criptografia forte como Blowfish e Doublefish.