Az irodalmárok jó ideje tudják, hogy a William Shakespeare egyik utolsó művének tartott VIII. Henriket többen írhatták, de mostanáig vita tárgya volt, hogy ki volt a világhírű szerző társa. A gépi tanuló algoritmusok azonban eldöntötték a vitát, a segítségükkel azonosították a kérdéses jeleneteket, és azt is pontosan tudják, hogy ki írta azokat.
Már a 19. század végén felmerült, hogy vagy Philip Massinger, vagy John Fletcher volt a társszerző a VIII. Henrikben. A mű néhány mondata feltűnően Fletcher stílusában íródott, hasonlít más műveire.
Szembetűnő apróságok árulkodtak a társszerzőről. Fletcher például gyakran használta a ye kifejezést a you helyett, de az 'em is jellemző rá a them alternatívájaként. A sorait pedig bátran megtoldotta egy sir, still vagy next szóval, ha a pentameter verselés úgy kívánta. Azt viszont nem tudták megállapítani az irodalmárok, hogy milyen mértékben nyúlt bele Fletcher a műbe.
Ugorjunk egyet a 21. századba, amikor Petr Plecháč, a Cseh Tudományos Akadémia munkatársa összekötötte a bölcsészetet a legmodernebb technológiákkal. Gépi tanuló algoritmussal nagyjából soronként azonosítani tudta a szerzőt, sikerült alátámasztani, hogy a második szerző Fletcher.
A gépet a lehetséges szerzők műveivel tanították be, és egy másik, rövidebb munkán tesztelték. Mivel egy író stílusa az élete során változik, fontos szempont volt, hogy csak a hasonló stílusú művek kerüljenek egy kalapba. Miután a számítógép megismeri a leggyakrabban használt szavakat és más mintázatokat, azokat olyan szövegekben is felismeri, amelyeket korábban még sohasem látott.
Plecháč a tanításhoz Shakespeare-től a Coriolanus, Cymbeline, Téli rege és A vihar című műveket táplálta be a rendszerbe, mert ezek születtek nagyjából egy időben a VIII. Henrikkel, míg Fletchertől a Valentinian, Monsieur Thomas, The Woman’s Prize és Bonduca műveket adta meg.
Az algoritmusok alátámasztották a korábbi feltételezéseket Fletcher részvételének mértékével kapcsolatban, ám ennél jóval kifinomultabb elemzést tettek lehetővé. Ebből kiderült, hogy sok esetben belenyúltak a szerzők egymás jeleneteibe.
Plecháč a biztonság kedvéért Massinger írásait is betáplálta a számítógépbe, és ez alapján nem valószínű, hogy köze volt a VIII. Henrikhez.
Az ehhez hasonló elemzésekre még sokféle lehetőség adódik, és nemcsak a szöveg tartalmára lehet fókuszálni, akár képelemző algoritmusokat is rá lehet ereszteni az eredeti, kézzel írt jegyzetekre.