Criptografia Numaboa
Quebrando uma transposição geométrica simples
Seg 26 Jan 2009 21:01 |
- Detalhes
- Categoria: Criptoanálise
- Atualização: Segunda, 26 Janeiro 2009 23:14
- Autor: vovó Vicki
- Acessos: 6270
Transposições geralmente são trabalhosas para serem quebradas e requerem várias tentativas e muita persistência. As transposições simples oferecem o menor grau de dificuldade por que a solução aparece no momento em que é determinado o tamanho da matriz.
Apesar disto, como em todo procedimento de criptoanálise, é importante ter um método de trabalho e seguir um roteiro planejado. Usaremos como exemplo o texto abaixo:
ORSLN ENRQU AIOEH UDCPU SDRHL AEIOE EHOAA ERQAN RQEAQ OSAUL TFUAI UPQEA OREEV GEEUU LGAIR INETE RQORT STOUR ROUDA OEORM OEPEE MUPRA PLMAR MEMRI NREMD ROMHO ACEOE EECBO VDITT SSSRU MAOAE AMFQA SERFN XMOAU THMFR OTBEZ IIOFO APOEH ECCLR RCOCM URIOI ATADL MMAOE DCESE AAIOD EEOBS R
Roteiro da Criptoanálise
- Obter informações sobre o contexto
- Determinar se a cifra realmente é de transposição
- Determinar o formato da matriz e o método
Informações sobre o contexto
Dentre as possíveis informações sobre o contexto destacam-se a origem e o destino da mensagem, o assunto tratado e o idioma. Nenhuma delas é conhecida, porém podemos tentar estabelecer o idioma utilizado.
Identificar corretamente o idioma de um texto cifrado nem sempre é uma tarefa fácil, principalmente quando se trata de um texto curto. Em todo caso, a primeira providência é estabelecer a frequência de ocorrência de letras:
25 | 3 | 8 | 8 | 34 | 5 | 2 | 6 | 12 | 0 | 0 | 7 | 14 | 6 | 27 | 6 | 7 | 24 | 10 | 9 | 14 | 10 | 0 | 1 | 0 | 1 |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Num total de 231 caracteres, chama a atenção a porcentagem de vogais (A E I O U): 48.5% ou 112 em 231. Além disto, a letra mais frequente é o E (15%). As consoantes de alta frequência (28%) são R M S T D, as de média frequência (21%) são C Q L P N H F B e as de baixa frequência (3%) são V G Z X W K J.
Pelos primeiros resultados, e principalmente pela forte presença da letra E, o idioma tem uma grande probabilidade de ser Português ou Espanhol. Confira lendo o artigo Frequência da Ocorrência de Letras no Português, o artigo Frequência da Ocorrência de Letras no Espanhol e compare os histogramas destes idiomas com o histograma da frequência de ocorrência de letras do texto cifrado (fig.1).
Determinando o tipo de cifra
O Índice de Coincidência pode nos revelar se se trata de uma cifra de transposição/substituição monoalfabética ou de uma substituição polialfabética. Calculando o Índice de Coincidência obtemos o valor Kappa = 0.074346, que corresponde a um IC = 1.93 (0.074346/0.0385), muito distante do IC de um texto randômico que seria 1.0 (0.0385/0.0385). Portanto, praticamente confirmamos nossa hipótese de transposição.
Como a distribuição da frequência de ocorrência das letras do texto cifrado segue um padrão quase idêntico ao encontrado no Português, podemos afirmar que se trata de uma transposição, pois uma substituição alteraria esta distribuição.
Um IC alto, como o encontrado, é típico de idiomas como o Português, o Francês e o Espanhol, porém apenas o Português e o Espanhol apresentam a letra E com uma frequência tão elevada.
Se tiver dúvidas, leia o texto Identificação de Classes, analisando principalmente as Tabelas de Kullback e o Teste Kappa de Friedman.
Determinando o formato da matriz
Em se tratando de uma transposição, a primeira providência é determinar se estamos lidando com uma matriz total ou parcialmente preenchida. Sabe-se que os criptógrafos utilizam preferencialmente formatos quadrados ou retangulares. Se todas as células foram preenchidas para se obter o texto cifrado, então precisamos encontrar uma divisão exata para as 231 letras: esta pode ser 3x77, 7x33, 11x21, 21x11, 33x7 e 77x3.
Os formatos 11x21 e 21x11 parecem os melhores, se bem que não excluem as outras possibilidades. Serão analisados primeiro.
Além disto, existe uma importante característica da língua portuguesa: quase 50% dos caracteres são vogais. Analisando a porcentagem das vogais em cada linha obtemos o seguinte resultado:
|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Os métodos mais comuns de transposição são entrada por linha/saída por coluna, entrada por coluna/saída por linha e transposição de colunas numeradas (chave). Em todos estes métodos, a mensagem clara é obtida pelo processo inverso, ou seja, uma entrada por linha/saída por coluna é decifrada com uma entrada por coluna/saída por linha.
Testando o primeiro processo nas duas matrizes, obtemos as seguintes matrizes transpostas:
|
| |||||||||||||||||||||||||||||||||
A solução
O texto da primeira matriz não faz o mínimo sentido. O da segunda, porém, nos revela a mensagem clara:
O IRAQUE E UM PRETEXTO CLARO HA O PETROLEO TAMBEM MAS ELES QUEREM MESMO E HUMILHAR A EUROPA DESFAZER A ONU E QUALQUER RESQUICIO DE DIALOGO DEMOCRATICO E ENCONTRARAM EM BUSH O LIDER PERFEITO UM HOMEM FRACO QUE QUER SE PROVAR FORTE BUSH E A VITORIA DO FRACASSADO A IGNORANCIA NO PODER
que, com os devidos acentos e sinais de pontuação, corresponde a um texto do Jabor:
O Iraque é um pretexto. Claro, há o petróleo também, mas eles querem mesmo é humilhar a Europa, desfazer a ONU e qualquer resquício de diálogo democrático. E encontraram em Bush o líder perfeito: um homem fraco que quer se provar forte. Bush é a vitória do fracassado, a ignorância no poder.
Observações
Quebrar uma cifra de transposição é um franco processo de tentativas. No caso das transposições simples, "basta" determinar as dimensões da matriz e a incidência de vogais. Nas transposições com chave ou nas transposições duplas, o processo é um pouco mais complexo.
No exemplo acima tivemos a "sorte" de escolher duas matrizes, das quais uma era a correta. A sorte, porém, não invalida o processo utilizado.
Só mais um detalhe: criptoanálise tem muito de Sorte e de Zen. Lembre-se disto