Criptografia Numaboa

Quebrando uma transposição geométrica simples

Seg

Jan

2009

21:01

(3 votos, média 3.67 de 5)

Detalhes: Categoria: Criptoanálise; Atualização: Segunda, 26 Janeiro 2009 23:14; Autor: vovó Vicki; Acessos: 7090

Transposições geralmente são trabalhosas para serem quebradas e requerem várias tentativas e muita persistência. As transposições simples oferecem o menor grau de dificuldade por que a solução aparece no momento em que é determinado o tamanho da matriz.

Apesar disto, como em todo procedimento de criptoanálise, é importante ter um método de trabalho e seguir um roteiro planejado. Usaremos como exemplo o texto abaixo:

ORSLN ENRQU AIOEH UDCPU SDRHL AEIOE EHOAA ERQAN RQEAQ OSAUL TFUAI UPQEA OREEV GEEUU LGAIR INETE RQORT STOUR ROUDA OEORM OEPEE MUPRA PLMAR MEMRI NREMD ROMHO ACEOE EECBO VDITT SSSRU MAOAE AMFQA SERFN XMOAU THMFR OTBEZ IIOFO APOEH ECCLR RCOCM URIOI ATADL MMAOE DCESE AAIOD EEOBS R

Roteiro da Criptoanálise

Obter informações sobre o contexto
Determinar se a cifra realmente é de transposição
Determinar o formato da matriz e o método

Informações sobre o contexto

Fig.1 - Histograma

Dentre as possíveis informações sobre o contexto destacam-se a origem e o destino da mensagem, o assunto tratado e o idioma. Nenhuma delas é conhecida, porém podemos tentar estabelecer o idioma utilizado.

Identificar corretamente o idioma de um texto cifrado nem sempre é uma tarefa fácil, principalmente quando se trata de um texto curto. Em todo caso, a primeira providência é estabelecer a frequência de ocorrência de letras:

25	3	8	8	34	5	2	6	12	0	0	7	14	6	27	6	7	24	10	9	14	10	0	1	0	1
A	B	C	D	E	F	G	H	I	J	K	L	M	N	O	P	Q	R	S	T	U	V	W	X	Y	Z

Num total de 231 caracteres, chama a atenção a porcentagem de vogais (A E I O U): 48.5% ou 112 em 231. Além disto, a letra mais frequente é o E (15%). As consoantes de alta frequência (28%) são R M S T D, as de média frequência (21%) são C Q L P N H F B e as de baixa frequência (3%) são V G Z X W K J.

Pelos primeiros resultados, e principalmente pela forte presença da letra E, o idioma tem uma grande probabilidade de ser Português ou Espanhol. Confira lendo o artigo Frequência da Ocorrência de Letras no Português, o artigo Frequência da Ocorrência de Letras no Espanhol e compare os histogramas destes idiomas com o histograma da frequência de ocorrência de letras do texto cifrado (fig.1).

Determinando o tipo de cifra

O Índice de Coincidência pode nos revelar se se trata de uma cifra de transposição/substituição monoalfabética ou de uma substituição polialfabética. Calculando o Índice de Coincidência obtemos o valor Kappa = 0.074346, que corresponde a um IC = 1.93 (0.074346/0.0385), muito distante do IC de um texto randômico que seria 1.0 (0.0385/0.0385). Portanto, praticamente confirmamos nossa hipótese de transposição.

Como a distribuição da frequência de ocorrência das letras do texto cifrado segue um padrão quase idêntico ao encontrado no Português, podemos afirmar que se trata de uma transposição, pois uma substituição alteraria esta distribuição.

Um IC alto, como o encontrado, é típico de idiomas como o Português, o Francês e o Espanhol, porém apenas o Português e o Espanhol apresentam a letra E com uma frequência tão elevada.

Se tiver dúvidas, leia o texto Identificação de Classes, analisando principalmente as Tabelas de Kullback e o Teste Kappa de Friedman.

Determinando o formato da matriz

Em se tratando de uma transposição, a primeira providência é determinar se estamos lidando com uma matriz total ou parcialmente preenchida. Sabe-se que os criptógrafos utilizam preferencialmente formatos quadrados ou retangulares. Se todas as células foram preenchidas para se obter o texto cifrado, então precisamos encontrar uma divisão exata para as 231 letras: esta pode ser 3x77, 7x33, 11x21, 21x11, 33x7 e 77x3.

Os formatos 11x21 e 21x11 parecem os melhores, se bem que não excluem as outras possibilidades. Serão analisados primeiro.

Além disto, existe uma importante característica da língua portuguesa: quase 50% dos caracteres são vogais. Analisando a porcentagem das vogais em cada linha obtemos o seguinte resultado:

ORSLNENRQUA	4 (36%)
IOEHUDCPUSD	5 (46%)
RHLAEIOEEHO	7 (64%)
AAERQANRQEA	6 (54%)
QOSAULTFUAI	6 (54%)
UPQEAOREEVG	6 (54%)
EEUULGAIRIN	7 (64%)
ETERQORTSTO	4 (36%)
URROUDAOEOR	7 (64%)
MOEPEEMUPRA	6 (54%)
PLMARMEMRIN	3 (27%)
REMDROMHOAC	4 (36%)
EOEEECBOVDI	7 (64%)
TTSSSRUMAOA	4 (36%)
EAMFQASERFN	4 (36%)
XMOAUTHMFRO	4 (36%)
TBEZIIOFOAP	6 (54%)
OEHECCLRRCO	4 (36%)
CMURIOIATAD	6 (54%)
LMMAOEDCESE	5 (46%)
AAIODEEOBSR	7 (64%)

ORSLNENRQUAIOEHUDCPUS	9 (43%)
DRHLAEIOEEHOAAERQANRQ	11 (52%)
EAQOSAULTFUAIUPQEAORE	13 (62%)
EVGEEUULGAIRINETERQOR	11 (52%)
TSTOURROUDAOEORMOEPEE	12 (57%)
MUPRAPLMARMEMRINREMDR	6 (29%)
OMHOACEOEEECBOVDITTSS	10 (48%)
SRUMAOAEAMFQASERFNXMO	9 (43%)
AUTHMFROTBEZIIOFOAPOE	11 (52%)
HECCLRRCOCMURIOIATADL	8 (38%)
MMAOEDCESEAAIODEEOBSR	12 (57%)
A matriz 21x11 parece ter uma distribuição de vogais ligeiramente melhor, com valores mais próximos de 48% e com uma distribuição mais uniforme.

Os métodos mais comuns de transposição são entrada por linha/saída por coluna, entrada por coluna/saída por linha e transposição de colunas numeradas (chave). Em todos estes métodos, a mensagem clara é obtida pelo processo inverso, ou seja, uma entrada por linha/saída por coluna é decifrada com uma entrada por coluna/saída por linha.

Testando o primeiro processo nas duas matrizes, obtemos as seguintes matrizes transpostas:

ODEETMOSAHM

RRAVSUMRUEM

SHQGTPHUTCA

LLOEOROMHCO

NASEUAAAMLE

EEAURPCOFRD

NIUURLEARRC

ROLLOMOEOCE

QETGUAEATOS

UEFADREMBCE

AHUIAMEFEMA

IOAROECQZUA

OAIIEMBAIRI

EAUNOROSIIO

HEPERIVEOOD

URQTMNDRFIE

DQEEORIFOAE

CAAREETNATO

PNOQPMTXPAB

URROEDSMODS

SQERERSOELR

OIRAQUEEUMPRETEXTOCLA

ROHAOPETROLEOTAMBEMMA

SELESQUEREMMESMOEHUMI

LHARAEUROPADESFAZERAO

NUEQUALQUERRESQUICIOD

EDIALOGODEMOCRATICOEE

NCONTRARAMEMBUSHOLIDE

RPERFEITOUMHOMEMFRACO

QUEQUERSEPROVARFORTEB

USHEAVITORIADOFRACASS

ADOAIGNORANCIANOPODER

A solução

O texto da primeira matriz não faz o mínimo sentido. O da segunda, porém, nos revela a mensagem clara:

O IRAQUE E UM PRETEXTO CLARO HA O PETROLEO TAMBEM MAS ELES QUEREM MESMO E HUMILHAR A EUROPA DESFAZER A ONU E QUALQUER RESQUICIO DE DIALOGO DEMOCRATICO E ENCONTRARAM EM BUSH O LIDER PERFEITO UM HOMEM FRACO QUE QUER SE PROVAR FORTE BUSH E A VITORIA DO FRACASSADO A IGNORANCIA NO PODER

que, com os devidos acentos e sinais de pontuação, corresponde a um texto do Jabor:

O Iraque é um pretexto. Claro, há o petróleo também, mas eles querem mesmo é humilhar a Europa, desfazer a ONU e qualquer resquício de diálogo democrático. E encontraram em Bush o líder perfeito: um homem fraco que quer se provar forte. Bush é a vitória do fracassado, a ignorância no poder.

Observações

Quebrar uma cifra de transposição é um franco processo de tentativas. No caso das transposições simples, "basta" determinar as dimensões da matriz e a incidência de vogais. Nas transposições com chave ou nas transposições duplas, o processo é um pouco mais complexo.

No exemplo acima tivemos a "sorte" de escolher duas matrizes, das quais uma era a correta. A sorte, porém, não invalida o processo utilizado.

Só mais um detalhe: criptoanálise tem muito de Sorte e de Zen. Lembre-se disto smile

Aldeia Numaboa UM PORTAL DIFERENTE EM PORTUGUÊS DO BRASIL

Navegação da pesquisa

Navegação

Pesquisa