Criptografia Numaboa
Quebrando uma grade giratória
Sab 31 Jan 2009 19:16 |
- Detalhes
- Categoria: Criptoanálise
- Atualização: Sábado, 31 Janeiro 2009 21:11
- Autor: vovó Vicki
- Acessos: 8605
A cifra de transposição geométrica de Fleissner usa uma grade que serve de padrão para a transposição. Para acompanhar este exercício de criptoanálise é imperioso que você conheça o método em detalhes - leia A grade giratória de Fleissner.
O texto cifrado
O seguinte texto foi enviado por um funcionário do Palácio do Planalto para um repórter de uma revista. Isto é tudo o que se sabe do criptograma:
plsual tlroao crqcoc auiser emmoir anstoi ozaend roabio rmrcaa ocsnen idtliu annvdu epranr etqeeu sscepx texrae xemxot ssiedt
Como o texto está em grupos de 6 caracteres, pressupõe-se que tenha sido cifrado com uma grade giratória de 6x6 células.
Caso o texto cifrado não estivesse separado em grupos de letras, teríamos que identificar o tamanho da grade utilizada. Aqui vai uma dica: a grade sempre tem o mesmo número de linhas e colunas, senão não seria possível girá-la. Como o criptograma possui 108 caracteres, as grades possíveis seriam 2x2, 3x3 e 6x6. Por que isto? Porque a grade 2x2 possui 4 células e a divisão 108÷4=27 (uma divisão exata); a grade 3x3 possui 9 células e a divisão 108÷9=12 também é uma divisão exata; a grade 4x4 possui 16 células e a divisão 108÷16=6.75 não é uma divisão exata... e assim por diante.
Entre uma grade de 2x2, 3x3 e 6x6, prefiro a 6x6. Esta será nossa primeira hipótese e então, antes de mais nada, é preciso por um pouco de ordem na disposição dos caracteres: cada letra ocupa uma célula identificada por um número de linha e um número de coluna. Transfira o texto cifrado para as três grades 6x6 (108÷36=3) necessárias. Você deve obter o seguinte:
|
|
|
Na criptoanálise do texto, sempre que nos referirmos à posição de uma letra, citamos sua linha e coluna (ex: no primeiro grupo 1,1 é a letra p; 2,1 é a letra t).
Agora partimos do pressuposto de que o texto é composto por 3 grupos que foram cifrados com o MESMO padrão de transposição.
Análise inicial
O texto é composto por 108 caracteres. O Índice de Coincidência (IC) do texto cifrado é 0.06352, indicando uma grande probabilidade de se tratar de uma TRANSPOSIÇÃO ou SUBSTITUIÇÃO MONOALFABÉTICA e do idioma ser românico (Francês 0.0778, Italiano 0.738, Espanhol 0.0775, Português 0.0791, Inglês 0.0661). Será que o funcionário do Planalto escreveu em Inglês?
Outra característica é que 43% dos caracteres são vogais. A frequência de ocorrência das letras é a seguinte:
f | 11 | 1 | 6 | 4 | 13 | 7 | 4 | 4 | 7 | 10 | 3 | 2 | 10 | 8 | 7 | 5 | 1 | 4 | 1 | |||||||
TC | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Partindo do pressuposto de que a mensagem foi cifrada com uma transposição (os agrupamentos de 6 caracteres sugerem esta cifra) e que esteja em Português, então a letra Q, que ocorre 2 vezes, tem uma grande probabilidade de ser seguida pela letra U. Além disto, sabemos que o trigrama QUE é um dos mais frequentes neste idioma. Este vai ser o primeiro ponto de abordagem.
O trigrama QUE
1 | 2 | 3 | 4 | 5 | 6 | |
1 | p | l | s | u | a | l |
2 | t | l | r | o | a | o |
3 | c | r | q | c | o | c |
4 | a | u | i | s | e | r |
5 | e | m | m | o | i | r |
6 | a | n | s | t | o | i |
Analisando o primeiro bloco cifrado, observa-se que ele contém 1 Q e 2 U. As combinações possíveis são as posições [3,3] [1,4] e [3,3] [4,2]. As mesmas posições, nos outros blocos, mostram dígrafos diferentes, mas que também deveriam formar palavras compreensíveis porque o padrão de transposição precisa ser o mesmo:
Posição [3,3] [1,4] Posição [3,3] [4,2] Bloco 1 Q U Q U Bloco 2 R E R C Bloco 3 C A C E
Ainda não esclarece muito, pois todos os dígrafos são possíveis. Façamos a combinação da terceira letra, escolhendo a mais provável (E):
|
|
|
Combinação 1 Combinação 3 Posição [3,3] [1,4] [4,5] Posição [3,3] [4,2] [4,5] Bloco 1 Q U E Q U E Bloco 2 R E E R C E Bloco 3 C A A C E A Combinação 2 Combinação 4 Posição [3,3] [1,4] [5,1] Posição [3,3] [4,2] [5,1] Bloco 1 Q U E Q U E Bloco 2 R E I R C I Bloco 3 C A X C E X
A primeira e a terceira combinações, quando as letras são lidas de cima para baixo e da esquerda para a direita, dariam como resultado UQE - não é o que procuramos. Restam a segunda e a quarta, das quais a segunda parece mais plausível. Analisemos nossa hipótese:
p | l | s | u | a | l |
t | l | r | o | a | o |
c | r | Q | c | o | c |
a | U | i | s | E | r |
e | m | m | o | i | r |
a | n | s | t | o | i |
Explicando a posição das células vazadas
1 | 2 | 3 | 4 | 5 | 1 |
5 | 1 | 2 | 3 | 1 | 2 |
4 | 3 | 1 | 1 | 2 | 3 |
3 | 2 | 1 | 1 | 3 | 4 |
2 | 1 | 3 | 2 | 1 | 5 |
1 | 5 | 4 | 3 | 2 | 1 |
Sabendo que a distribuição das células vazadas precisa ser tal que, ao se girar a grade 4 vezes, todas as células tenham sido expostas uma vez, há um método para determinar as posições vazadas. Divide-se o quadrado em quadrados concêntricos. Cada um destes quadrados contém um número de células vazadas igual ao número de células de um lado menos 1. A partir daí, numera-se as células no sentido horário. Depois disto escolhe-se um de cada número de cada camada para ser a célula vazada (observe à esquerda).
De acordo com a explicação, se escolhermos uma célula da camada azul (todas são numeradas com 1), nenhuma outra célula desta camada poderá ser vazada. Se escolhermos a célula superior esquerda da camada vermelha (numerada com 1), nenhuma outra célula de número 1 da camada vermelha poderá ser vazada.
Voltando ao trigrama QUE
|
|
Se as células contendo o trigrama QUE forem as vazadas, então automaticamente algumas células precisam estar fechadas (veja à esquerda).
A exclusão das células que NÃO podem estar vazadas diminui em 9 o conjunto de caracteres possíveis. Agora é começar a brincar de "caça palavras". Antes do QUE existem apenas 11 letras que podem ser consideradas. Começando com o P, podemos formar, por exemplo, PUA - PULA - PULO - PALA - PATA - PATO. Considerando o L, é possível formar LUA - LULA - LUTA - LUTO - LATA - LATÃO. Com o S podemos formar SUA - SUL - SULTÃO - SAL - SALA - SALTO e com o T é possível formar TÃO.
A palavra que chama a atenção, já que o bilhete veio do Palácio do Planalto, é LULA! Vale a pena testar esta hipótese:
Posição [1,2] [1,4] [1,6] [2,5] Posição [3,3] [4,2] [4,5] Bloco 1 L U L A Q U E Bloco 2 Z E D I R C E Bloco 3 P A R E C E A Associando os blocos temos: LULAQUE -> LULA QUE ZEDIRCE -> ZE DIRCE PARECEA -> PARECE A
Sorte de principiante ou Zen?
Parece começar a fazer sentido. ZE DIRCE pode muito bem ser ZÉ DIRCEU. Se estivermos no caminho certo, vamos eliminar novamente as células que não podem estar vazadas:
L | s | U | a | L | |
t | A | ||||
Q | c | ||||
a | U | E | |||
r | |||||
n | t |
Das 9 células vazadas possíveis, aparentemente já descobrimos 7. Acontece que, se a palavra realmente for LULA, então as células entre estas letras precisam estar fechadas. O mesmo raciocínio se aplica para a palavra QUE.
L | U | L | |||
A | |||||
Q | |||||
U | E | ||||
r | |||||
n | t |
Restam apenas 3 posições, das quais precisamos escolher 2. Os outros blocos podem dar mais informações:
|
|
A primeira grade possível
Se considerarmos que o segundo bloco contém ZÉ DIRCEU, então a célula [4,6] parece ser uma das que procuramos. No primeiro bloco teríamos LULA QUER, no segundo ZÉ DIRCEU e no terceiro PARECE AT. Com isto, restam apenas duas letras soltas no primeiro e segundo bloco, mas o terceiro poderia ser PARECE ATÉ. Se esta última hipótese estiver correta, identificamos as 9 células vazadas e a grade teria este aspecto:
. | |||||
. | |||||
. | |||||
. | |||||
. | |||||
. |
DECIFRANDO A MENSAGEM
Utilizando a grade giratória sobre o texto cifrado encontra-se o seguinte:
LULAQUERTROCARMINISTROSMASOPALOCCIEOZEDIRCEUVAOCONTINUAR MANDANDONOBRASILPARECEATEQUETEMOSTRESPRESIDENTESXXXX
ou seja,
LULA QUER TROCAR MINISTROS MAS O PALOCCI E O ZÉ DIRCEU VÃO CONTINUAR MANDANDO NO BRASIL. PARECE ATÉ QUE TEMOS TRÊS PRESIDENTES XXXX
Considerações finais
Foram os seguintes os ingredientes que possibilitaram achar uma solução:
- O reconhecimento do método de cifragem através de constatações estatísticas e características do aspecto do texto cifrado.
- O processo de anagramas múltiplos (o caça palavras). Apenas com um bloco já foi possível encontrar pontos de apoio suficientes para não enveredar pelo caminho menos provável.
- Conhecimento do contexto que possibilitou a escolha das palavras mais prováveis.
- A sorte de encontrar o trigrama "QUE".
- A observação das posições ocupadas pelas letras prováveis e consequente exclusão das posições correlatas.
- A possibilidade de diminuir o número de letras com as quais formar palavras, aumentando a chance de acerto.
Você pode estar pensando "este exemplo foi preparado para dar certo", mas você vai se admirar: apesar de parecer muito complicada, a cifra giratória é bem menos segura do que se imagina (complicação não é segurança!). Caso o trigrama "QUE" não estivesse presente, ainda assim a técnica de "caça palavras" nos teria levado a possibilidades muito boas. Lembre-se de que o primeiro bloco é constituído por 36 letras e que o comprimento médio das palavras no Português é de 5 a 6 letras. Isto nos dá a certeza de encontrar pelo menos uma palavra inteira no primeiro bloco.
Além disto, os trigramas mais frequentes no Português são QUE, ENT e COM e já vimos que um trigrama pode fazer "milagres".
A última observação se refere a um ponto vital da criptoanálise em geral: muitas vezes as observações não levam a uma conclusão definitiva, mas sim a possibilidades mais prováveis ou menos prováveis. Neste caso, deve-se explorar inicialmente a mais provável. Caso não leve a um resultado satisfatório, abandona-se esta hipótese e explora-se a segunda mais provável. É assim que se constrói uma estratégia de trabalho que possibilita percorrer caminhos decisórios com a melhor probabilidade de sucesso.
E lembre-se, a criptoanálise é um EXERCÍCIO DE IMAGINAÇÃO. Se você não estiver num dia inspirado, não force a barra - espere uma maré Zen para tentar novamente