Het is bijna zes decennia geleden dat Warren Weaver, een pionier im automatische vertalingen, suggereerde om technieken voor het breken van geheime codes toe te passen bij de ontcijfering en interpretatie van vreemde talen. In een vaak geciteerde brief uit 1947 aan de wiskundige Norbert Wiener schreef hij: ‘One naturally wonders if the problem of translation could conceivably be treated as a problem in cryptography. When I look at an article in Russian, I say: ‘This is really written in English, but it has been coded in some strange symbols. I will now proceed to decode’’.
Dit inzicht leidde tot het ontstaan van statistisch onderbouwde taalprogramma’s zoals Google Translate en, niet zo vreemd, tot de ontwikkeling van nieuwe tools voor het kraken van geheimcodes, teruggaande tot in de middeleeuwen.
Een team van Zweedse en Amerikaanse linguisten heeft nu deze statistisch-gebaseerde vertaaltechnieken toegepast op een van de moeilijkst te ontcijferen codes: de Copiale Cipher, een handgeschreven manuscript van 105 pagina’s en 75.000 tekens, dat dateert (waarschijnlijk) uit het eind van de 18de eeuw. Ze hebben hun werk gepresenteerd op een congres van de Association for Computational Linguistics in Portland.
Het mooi gebonden manuscript telt 75.000 tekens in een fantastische mix van mysterieuze symbolen en gewone letters. De naam komt van een van de niet gecodeerde inscripties in het manuscript. Het werd gevonden in een academisch archief in het oude Oost-Duitsland.