Aquest text antic no te ni títol ni autor coneguts, i
està escrit en un idioma també desconegut. Què és el que diu i per què te tantes il·lustracions astronòmiques? L'enigmàtic llibre va ser comprat per un emperador, oblidat al prestatge d'una biblioteca, venut després per milers de dòlars, i finalment donat a la Universitat de Yale. Escrit probablement al segle XV, el volum de més de 200 pàgines es coneix molt més recentment com el Manuscrit Voynich, després del seu (re)descobriment l'any 1912. La imatge és una il·lustració del llibre que sembla que està relacionada, d'alguna manera, amb el Sol. El llibre retola algunes
parts del cel on s'hi veuen constel·lacions que no ens són gens familiars. La impossibilitat dels moderns historiadors de l'astronomia per a comprendre els orígens d'aquestes constel·lacions potser és conseqüència de la incapacitat dels actuals descodificadors per a entendre el text del llibre. El llibre està ara a la col·lecció de llibres rars de la biblioteca de la Universitat de Yale, amb el número de catàleg "MS 408".

El text (anomenat voynichès) va ser clarament escrit d'esquerra a dreta, amb un marge dret desigual. Les seccions més extenses es troben partides en paràgrafs, normalment amb "vinyetes" en el marge esquerre. No hi ha evidència de signes de puntuació. El text és fluït, com si el que escrigués entengués el que estava escrivint mentre ho feia; el manuscrit no dóna la impressió de què cada caràcter hagi hagut de ser calculat abans de ser escrit a la pàgina.
El text consta de més de 170.000 glifs (caràcters gràfics), normalment separats uns dels altres per petits espais. La majoria dels caràcters estan escrits amb un o dos traços senzills. Considerant que existeixen disputes sobre si certs caràcters són diferents o no, es calcula que l'alfabet sencer consta d'entre 20 i 30 caràcters totals per a quasi tot el text, amb les excepcions rares d'algunes dotzenes de caràcters "estranys" , trobats una o dues vegades en tot el text.
Els espais més amplis divideixen el text en unes 35.000 "paraules" de longitud variada. Sembla que segueixen una certa fonètica o regles ortogràfiques d'un cert tipus; per exemple, alguns caràcters han d'aparèixer a cada paraula (com les vocals en català), alguns caràcters mai segueixen a d'altres, alguns poden ser dobles però d'altres no.
L'anàlisi estadístic del text va revelar patrons similars als dels llenguatges naturals. Per exemple, la freqüència de paraules segueix la llei de Zipf i l' entropia (al voltant de 10 bits per paraula) és similar a la de textos en llatí. Algunes paraules apareixen exclusivament en determinades seccions, o només en algunes pàgines; altres són freqüents en tot el manuscrit. Existeixen molt poques repeticions entre els milers de "llegendes" adjuntes a les il·lustracions. En la secció herbari, la primera paraula de cada pàgina apareix només en aquella pàgina, pel que podria representar el nom de la planta.
D'altra banda, l' "idioma" del manuscrit Voynich, el voynichès, és diferent dels idiomes europeus en diversos aspectes. En particular, no existeixen paraules de més de 10 "lletres". A més, la distribució de les lletres en una paraula és peculiar: alguns caràcters apareixen només al principi d'una paraula, d'altres només al final, i d'altres sempre al mig.
El text sembla més repetitiu que els típics idiomes europeus; existeixen seqüències en les quals la mateixa paraula comú apareix fins a tres vegades consecutives.
