Wiersze AI podobają się bardziej niż poezja Szekspira

18 marca 2026

Wprowadzenie

Badanie opublikowane w Scientific Reports (Nature) dostarczyło wyników, które powinny zainteresować każdego, kto uważa, że ludzką twórczość łatwo odróżnić od maszynowej. Okazuje się, że nie tylko nie potrafimy rozpoznać wierszy napisanych przez AI, ale wręcz wolimy je od poezji wielkich poetów.

Eksperyment: Szekspir kontra ChatGPT

Brian Porter i Edouard Machery z University of Pittsburgh przeprowadzili dwa eksperymenty z udziałem ponad 2 300 osób. Wzięli po pięć wierszy od dziesięciu znanych poetów anglojęzycznych, obejmujących praktycznie całą historię literatury anglojęzycznej: od Geoffreya Chaucera, przez Szekspira, Byrona, Walta Whitmana, Emily Dickinson, T.S. Eliota, aż po Sylvię Plath. Następnie poprosili ChatGPT 3.5 o napisanie pięciu wierszy “w stylu” każdego z tych poetów.

Co ważne, zastosowali podejście “human out of the loop”, czyli nie wybierali najlepszych wierszy z wielu prób. Wzięli po prostu pierwsze pięć wygenerowanych wierszy, bez żadnej selekcji ani poprawek. To był surowy output modelu i nic poza tym.

Wyniki, które zaskakują

W pierwszym eksperymencie 1 634 uczestników miało rozpoznać, które wiersze napisał człowiek, a które AI. Trafność odpowiedzi wyniosła 46.6%, co jest wynikiem poniżej poziomu losowego (50%). Gdyby uczestnicy rzucali monetą, poradziliby sobie lepiej niż polegając na własnej intuicji.

Ale to nie koniec niespodzianek. Uczestnicy częściej uznawali wiersze AI za ludzkie niż faktycznie ludzkie wiersze. Pięć wierszy z najniższym odsetkiem odpowiedzi “ludzki” to były wyłącznie wiersze prawdziwych poetów. Cztery z pięciu wierszy z najwyższym odsetkiem odpowiedzi “ludzki” były wygenerowane przez AI.

Doświadczenie z poezją nie pomagało. 90% uczestników czytało poezję najwyżej kilka razy w roku, ale nawet ci, którzy czytali więcej, nie radzili sobie lepiej. Jedyną rzeczą, która pomagała w rozpoznaniu, było wcześniejsze spotkanie się z konkretnym wierszem.

Dlaczego wolimy wiersze AI?

W drugim eksperymencie 696 nowych uczestników oceniało wiersze pod kątem czternastu wymiarów jakościowych: ogólnej jakości, rytmu, obrazowości, piękna, głębi, oryginalności i innych. Wyniki były jednoznaczne: wiersze AI oceniano wyżej niż wiersze ludzkich poetów w trzynastu z czternastu kategorii. Jedynym wyjątkiem była “oryginalność”, gdzie różnica nie była statystycznie istotna.

Największa różnica dotyczyła rytmu. Wiersze AI były oceniane jako mające znacznie lepszy rytm niż wiersze słynnych poetów (Cohen’s d = 0.847, co jest dużym efektem). Wszystkie pięć wierszy AI uzyskało wyższe oceny ogólnej jakości niż wszystkie pięć wierszy ludzkich.

Badacze proponują proste wyjaśnienie tego paradoksu: wiersze AI są bardziej przystępne. Komunikują emocje i tematy w sposób bardziej bezpośredni, łatwiejszy do zrozumienia. Uczestnicy 144 razy użyli zwrotów w stylu “nie ma sensu” opisując wiersze ludzkich poetów i tylko 29 razy przy wiersach AI. Dla nieekspertów złożoność Szekspira czy Plath wygląda na niespójność, a przejrzystość ChatGPT na talent.

Uprzedzenie działa w obie strony

Badanie ujawniło jeszcze jeden ciekawy mechanizm. Gdy uczestnikom powiedziano, że wiersz napisał człowiek, oceniali go wyżej. Gdy powiedziano, że wygenerował go AI, oceniali niżej. To samo dotyczyło wszystkich czternastu wymiarów jakości. Mamy więc do czynienia z podwójnym paradoksem: ludziom bardziej podobają się wiersze AI, ale jednocześnie mają uprzedzenie wobec AI jako autora.

Ten mechanizm wyjaśnia efekt “bardziej ludzki niż człowiek”. Uczestnicy zakładali, że lepszy wiersz musi być ludzki, bo przecież AI pisze gorzej (tak im się wydawało). Kiedy jednak badacze uwzględnili oceny jakościowe w modelu statystycznym, efekt autorstwa zniknął. To nie AI pisało “bardziej po ludzku”, to ludzie mylili prostotę z autentycznością.

A co jeśli AI nauczy się pisać jak konkretny autor?

Badanie z Nature dotyczyło poezji i ChatGPT 3.5, ale świeży preprint z SSRN (Chakrabarty, Ginsburg i Dhillon, 2026) poszedł znacznie dalej. Badacze wzięli nowsze modele: GPT-4o, Claude 3.5 Sonnet i Gemini 1.5 Pro, a zamiast poezji postawili na prozę literacką. Zadanie polegało na napisaniu fragmentu do 450 słów w stylu jednego z 50 uznanych autorów, w tym noblistów (Han Kang, Annie Ernaux), laureatów Bookera (Salman Rushdie, Margaret Atwood) i Pulitzera (Junot Díaz, Marilynne Robinson).

Oceniających podzielono na dwie grupy: 28 ekspertów z dyplomem MFA (Master of Fine Arts, odpowiednik doktoratu w dziedzinie twórczego pisarstwa) i 516 zwykłych czytelników z wykształceniem wyższym. Wyniki były fascynujące.

Przy zwykłym promptowaniu (“napisz fragment w stylu X”) eksperci MFA zdecydowanie woleli teksty ludzkie. Stosunek szans wynosił 0.13 dla jakości pisarstwa, co oznacza, że eksperci prawie 8-krotnie częściej wybierali ludzkiego autora. Ale zwykli czytelnicy już na tym etapie woleli AI (OR=1.82 dla jakości).

Prawdziwy przełom nastąpił po fine-tuningu, czyli dotrenowaniu modelu na pełnym dorobku danego autora. Nagle nawet eksperci MFA zaczęli preferować tekst AI: stosunek szans skoczył do 8.16 na korzyść AI w wierności stylowi i 1.87 w jakości. Zwykli czytelnicy preferowali AI jeszcze mocniej (OR=16.65 i 5.42). Detektory AI rozpoznawały fine-tunowane teksty zaledwie w 3% przypadków, w porównaniu z 97% dla zwykłego promptowania.

I jeszcze jedno: mediana kosztu fine-tuningu i generowania tekstu wynosiła 81 dolarów na autora. To 99.7% taniej niż wynagrodzenie profesjonalnego pisarza.

A co z codziennym pisaniem?

Pisałem kiedyś o tym, czy używanie treści ChatGPT jako własnych wypowiedzi jest w porządku. Argumentowałem wtedy, że w dyskusjach merytorycznych liczy się wartość argumentu, a nie to, kto go sformułował. Te dwa badania, wzięte razem, dostarczają twardych danych wspierających tę intuicję. Jeśli nawet w poezji i prozie literackiej ludzie nie potrafią odróżnić AI od człowieka (a często wolą AI), to co to mówi o codziennych e-mailach czy postach na LinkedIn?

Moim zdaniem mówi to, że granica między “ludzkim” a “maszynowym” tekstem jest w dużej mierze iluzją, a z czasem będzie się zacierać jeszcze bardziej. AI nie pisze po prostu “wystarczająco dobrze”. Pisze w sposób, który nieekspertom wydaje się lepszy, bo jest prostszy i czytelniejszy. A po fine-tuningu na dorobku konkretnego autora potrafi zmylić nawet ekspertów.

Jest w tym pewna ironia. Poeci i pisarze latami pracują nad złożonością i wieloznacznością swoich tekstów, a potem przychodzi model językowy, który pisze prosto i bezpośrednio, i czytelnicy wolą właśnie to. Wolą, bo jest bardziej dostępne, a nie “lepsze” w jakimkolwiek głębszym sensie. Nasze wyobrażenie o tym, jak “powinien” wyglądać dobry tekst, niekoniecznie pokrywa się z tym, co faktycznie lubimy czytać. Warto o tym pamiętać, zanim następnym razem ktoś z oburzeniem napisze na LinkedIn, że “kopiowanie z ChatGPT to oszustwo”.

Więcej o ATS i Element przeczytasz tutaj.

Najczęściej czytane:

Darmowe ogłoszenia o pracę i największa lista źródeł kandydatów – największa w Polsce lista bezpłatnych i płatnych źródeł kandydatów
Praca w HR – najnowsze oferty pracy i aktualne średnie wynagrodzenia w branży HR
Akademia Rekrutacji – zbiór wiedzy na temat rekrutacji oraz raporty z rynku pracy.
Gowork – jak reagować na negatywne opinie o pracodawcach – Kompleksowy poradnik dla pracodawców.
Jak napisać CV i profil LinkedIn – kompleksowy poradnik tworzenia CV i profilów LinkedIn
RODO w rekrutacji – sourcing, direct search, ogłoszenia. Wszystko co musisz wiedzieć – kompleksowy poradnik RODO w rekrutacji z naciskiem na działania typu direct search / sourcing.
Wszystko o systemach ATS – poradnik wyboru systemu rekrutacyjnego
Umowy przedwstępne i listy intencyjne w procesach rekrutacyjnych – wszystko, co musisz wiedzieć o prawnych zabezpieczeniach zobowiązania do zatrudnienia.

Maciej Michalewski

Founder & CEO @ Element

Nasze artykuły przeczytasz także na Medium, LinkedIn, Substack, Reddit

Ostatnie wpisy:

Wielka reorganizacja: firmy przebudowują się wokół AI

Maciej Michalewski 1 kwietnia 2026

Foundation Capital zbadało 25 firm i odkryło, że AI zmienia nie tylko narzędzia, ale całą strukturę organizacji. Cztery role pozostaną ludzkie.

Czytaj więcej »

Social Media polaryzują. AI depolaryzuje?

Maciej Michalewski 30 marca 2026

Social Media polaryzują. AI depolaryzuje? Wprowadzenie Niedawno chwaliłem Groka za fakt, że najmniej halucynuje i jest najmniej politycznie poprawny. Teraz mamy kolejne dane, które uzupełniają

Czytaj więcej »

Robot z polskim rodowodem, który wkręca śruby szybciej od człowieka

Maciej Michalewski 24 marca 2026

Robot z polskim rodowodem, który wkręca śruby szybciej od człowieka Kiedy mówimy o automatyzacji, większość ludzi myśli o chatbotach, generatorach obrazów i asystentach programowania. Tymczasem

Czytaj więcej »