A Aldeia Numaboa ancestral ainda está disponível para visitação. É a versão mais antiga da Aldeia que eu não quis simplesmente descartar depois de mais de 10 milhões de pageviews. Como diz a Sirley, nossa cozinheira e filósofa de plantão: "Misericórdia, ai que dó!"

Se você tiver curiosidade, o endereço é numaboa.net.br.

Leia mais...

Criptografia Numaboa

Quebrando uma transposição geométrica simples

Seg

26

Jan

2009


21:01

(3 votos, média 3.67 de 5) 


Transposições geralmente são trabalhosas para serem quebradas e requerem várias tentativas e muita persistência. As transposições simples oferecem o menor grau de dificuldade por que a solução aparece no momento em que é determinado o tamanho da matriz.

Apesar disto, como em todo procedimento de criptoanálise, é importante ter um método de trabalho e seguir um roteiro planejado. Usaremos como exemplo o texto abaixo:

ORSLN ENRQU AIOEH UDCPU SDRHL AEIOE EHOAA ERQAN RQEAQ OSAUL TFUAI UPQEA OREEV GEEUU LGAIR INETE RQORT STOUR ROUDA OEORM OEPEE MUPRA PLMAR MEMRI NREMD ROMHO ACEOE EECBO VDITT SSSRU MAOAE AMFQA SERFN XMOAU THMFR OTBEZ IIOFO APOEH ECCLR RCOCM URIOI ATADL MMAOE DCESE AAIOD EEOBS R

Roteiro da Criptoanálise

  1. Obter informações sobre o contexto
  2. Determinar se a cifra realmente é de transposição
  3. Determinar o formato da matriz e o método
Informações sobre o contexto
Histograma
Fig.1 - Histograma

Dentre as possíveis informações sobre o contexto destacam-se a origem e o destino da mensagem, o assunto tratado e o idioma. Nenhuma delas é conhecida, porém podemos tentar estabelecer o idioma utilizado.

Identificar corretamente o idioma de um texto cifrado nem sempre é uma tarefa fácil, principalmente quando se trata de um texto curto. Em todo caso, a primeira providência é estabelecer a frequência de ocorrência de letras:

25388345 2612007 146276724 109141001 01
ABCDEFGHIJKLMNOPQRSTUVWXYZ

Num total de 231 caracteres, chama a atenção a porcentagem de vogais (A E I O U): 48.5% ou 112 em 231. Além disto, a letra mais frequente é o E (15%). As consoantes de alta frequência (28%) são R M S T D, as de média frequência (21%) são C Q L P N H F B e as de baixa frequência (3%) são V G Z X W K J.

Pelos primeiros resultados, e principalmente pela forte presença da letra E, o idioma tem uma grande probabilidade de ser Português ou Espanhol. Confira lendo o artigo Frequência da Ocorrência de Letras no Português, o artigo Frequência da Ocorrência de Letras no Espanhol e compare os histogramas destes idiomas com o histograma da frequência de ocorrência de letras do texto cifrado (fig.1).

Determinando o tipo de cifra

O Índice de Coincidência pode nos revelar se se trata de uma cifra de transposição/substituição monoalfabética ou de uma substituição polialfabética. Calculando o Índice de Coincidência obtemos o valor Kappa = 0.074346, que corresponde a um IC = 1.93 (0.074346/0.0385), muito distante do IC de um texto randômico que seria 1.0 (0.0385/0.0385). Portanto, praticamente confirmamos nossa hipótese de transposição.

Como a distribuição da frequência de ocorrência das letras do texto cifrado segue um padrão quase idêntico ao encontrado no Português, podemos afirmar que se trata de uma transposição, pois uma substituição alteraria esta distribuição.

Um IC alto, como o encontrado, é típico de idiomas como o Português, o Francês e o Espanhol, porém apenas o Português e o Espanhol apresentam a letra E com uma frequência tão elevada.

Se tiver dúvidas, leia o texto Identificação de Classes, analisando principalmente as Tabelas de Kullback e o Teste Kappa de Friedman.

Determinando o formato da matriz

Em se tratando de uma transposição, a primeira providência é determinar se estamos lidando com uma matriz total ou parcialmente preenchida. Sabe-se que os criptógrafos utilizam preferencialmente formatos quadrados ou retangulares. Se todas as células foram preenchidas para se obter o texto cifrado, então precisamos encontrar uma divisão exata para as 231 letras: esta pode ser 3x77, 7x33, 11x21, 21x11, 33x7 e 77x3.

Os formatos 11x21 e 21x11 parecem os melhores, se bem que não excluem as outras possibilidades. Serão analisados primeiro.

Além disto, existe uma importante característica da língua portuguesa: quase 50% dos caracteres são vogais. Analisando a porcentagem das vogais em cada linha obtemos o seguinte resultado:

ORSLNENRQUA4 (36%)
IOEHUDCPUSD5 (46%)
RHLAEIOEEHO7 (64%)
AAERQANRQEA6 (54%)
QOSAULTFUAI6 (54%)
UPQEAOREEVG6 (54%)
EEUULGAIRIN7 (64%)
ETERQORTSTO4 (36%)
URROUDAOEOR7 (64%)
MOEPEEMUPRA6 (54%)
PLMARMEMRIN3 (27%)
REMDROMHOAC4 (36%)
EOEEECBOVDI7 (64%)
TTSSSRUMAOA4 (36%)
EAMFQASERFN4 (36%)
XMOAUTHMFRO4 (36%)
TBEZIIOFOAP6 (54%)
OEHECCLRRCO4 (36%)
CMURIOIATAD6 (54%)
LMMAOEDCESE5 (46%)
AAIODEEOBSR7 (64%)
ORSLNENRQUAIOEHUDCPUS9 (43%)
DRHLAEIOEEHOAAERQANRQ11 (52%)
EAQOSAULTFUAIUPQEAORE13 (62%)
EVGEEUULGAIRINETERQOR11 (52%)
TSTOURROUDAOEORMOEPEE12 (57%)
MUPRAPLMARMEMRINREMDR6 (29%)
OMHOACEOEEECBOVDITTSS10 (48%)
SRUMAOAEAMFQASERFNXMO9 (43%)
AUTHMFROTBEZIIOFOAPOE11 (52%)
HECCLRRCOCMURIOIATADL8 (38%)
MMAOEDCESEAAIODEEOBSR12 (57%)

A matriz 21x11 parece ter
uma distribuição de vogais
ligeiramente melhor, com
valores mais próximos de
48% e com uma distribuição
mais uniforme.

Os métodos mais comuns de transposição são entrada por linha/saída por coluna, entrada por coluna/saída por linha e transposição de colunas numeradas (chave). Em todos estes métodos, a mensagem clara é obtida pelo processo inverso, ou seja, uma entrada por linha/saída por coluna é decifrada com uma entrada por coluna/saída por linha.

Testando o primeiro processo nas duas matrizes, obtemos as seguintes matrizes transpostas:

ODEETMOSAHM
RRAVSUMRUEM
SHQGTPHUTCA
LLOEOROMHCO
NASEUAAAMLE
EEAURPCOFRD
NIUURLEARRC
ROLLOMOEOCE
QETGUAEATOS
UEFADREMBCE
AHUIAMEFEMA
IOAROECQZUA
OAIIEMBAIRI
EAUNOROSIIO
HEPERIVEOOD
URQTMNDRFIE
DQEEORIFOAE
CAAREETNATO
PNOQPMTXPAB
URROEDSMODS
SQERERSOELR
OIRAQUEEUMPRETEXTOCLA
ROHAOPETROLEOTAMBEMMA
SELESQUEREMMESMOEHUMI
LHARAEUROPADESFAZERAO
NUEQUALQUERRESQUICIOD
EDIALOGODEMOCRATICOEE
NCONTRARAMEMBUSHOLIDE
RPERFEITOUMHOMEMFRACO
QUEQUERSEPROVARFORTEB
USHEAVITORIADOFRACASS
ADOAIGNORANCIANOPODER

A solução

O texto da primeira matriz não faz o mínimo sentido. O da segunda, porém, nos revela a mensagem clara:

O IRAQUE E UM PRETEXTO CLARO HA O PETROLEO TAMBEM MAS ELES QUEREM MESMO E HUMILHAR A EUROPA DESFAZER A ONU E QUALQUER RESQUICIO DE DIALOGO DEMOCRATICO E ENCONTRARAM EM BUSH O LIDER PERFEITO UM HOMEM FRACO QUE QUER SE PROVAR FORTE BUSH E A VITORIA DO FRACASSADO A IGNORANCIA NO PODER

que, com os devidos acentos e sinais de pontuação, corresponde a um texto do Jabor:

O Iraque é um pretexto. Claro, há o petróleo também, mas eles querem mesmo é humilhar a Europa, desfazer a ONU e qualquer resquício de diálogo democrático. E encontraram em Bush o líder perfeito: um homem fraco que quer se provar forte. Bush é a vitória do fracassado, a ignorância no poder.

Observações

Quebrar uma cifra de transposição é um franco processo de tentativas. No caso das transposições simples, "basta" determinar as dimensões da matriz e a incidência de vogais. Nas transposições com chave ou nas transposições duplas, o processo é um pouco mais complexo.

No exemplo acima tivemos a "sorte" de escolher duas matrizes, das quais uma era a correta. A sorte, porém, não invalida o processo utilizado.

Só mais um detalhe: criptoanálise tem muito de Sorte e de Zen. Lembre-se disto smile

игровой автомат колумб columbusинтернет магазин набор посудыадреса никас блендер кофемолкакистипроизводители посуды в россииникос ресторан

Informações adicionais