Wiersze AI podobają się bardziej niż poezja Szekspira
Wprowadzenie
Badanie opublikowane w Scientific Reports (Nature) dostarczyło wyników, które powinny zainteresować każdego, kto uważa, że ludzką twórczość łatwo odróżnić od maszynowej. Okazuje się, że nie tylko nie potrafimy rozpoznać wierszy napisanych przez AI, ale wręcz wolimy je od poezji wielkich poetów.
Eksperyment: Szekspir kontra ChatGPT
Brian Porter i Edouard Machery z University of Pittsburgh przeprowadzili dwa eksperymenty z udziałem ponad 2 300 osób. Wzięli po pięć wierszy od dziesięciu znanych poetów anglojęzycznych, obejmujących praktycznie całą historię literatury anglojęzycznej: od Geoffreya Chaucera, przez Szekspira, Byrona, Walta Whitmana, Emily Dickinson, T.S. Eliota, aż po Sylvię Plath. Następnie poprosili ChatGPT 3.5 o napisanie pięciu wierszy “w stylu” każdego z tych poetów.
Co ważne, zastosowali podejście “human out of the loop”, czyli nie wybierali najlepszych wierszy z wielu prób. Wzięli po prostu pierwsze pięć wygenerowanych wierszy, bez żadnej selekcji ani poprawek. To był surowy output modelu i nic poza tym.
Wyniki, które zaskakują
W pierwszym eksperymencie 1 634 uczestników miało rozpoznać, które wiersze napisał człowiek, a które AI. Trafność odpowiedzi wyniosła 46.6%, co jest wynikiem poniżej poziomu losowego (50%). Gdyby uczestnicy rzucali monetą, poradziliby sobie lepiej niż polegając na własnej intuicji.
Ale to nie koniec niespodzianek. Uczestnicy częściej uznawali wiersze AI za ludzkie niż faktycznie ludzkie wiersze. Pięć wierszy z najniższym odsetkiem odpowiedzi “ludzki” to były wyłącznie wiersze prawdziwych poetów. Cztery z pięciu wierszy z najwyższym odsetkiem odpowiedzi “ludzki” były wygenerowane przez AI.
Doświadczenie z poezją nie pomagało. 90% uczestników czytało poezję najwyżej kilka razy w roku, ale nawet ci, którzy czytali więcej, nie radzili sobie lepiej. Jedyną rzeczą, która pomagała w rozpoznaniu, było wcześniejsze spotkanie się z konkretnym wierszem.
Dlaczego wolimy wiersze AI?
W drugim eksperymencie 696 nowych uczestników oceniało wiersze pod kątem czternastu wymiarów jakościowych: ogólnej jakości, rytmu, obrazowości, piękna, głębi, oryginalności i innych. Wyniki były jednoznaczne: wiersze AI oceniano wyżej niż wiersze ludzkich poetów w trzynastu z czternastu kategorii. Jedynym wyjątkiem była “oryginalność”, gdzie różnica nie była statystycznie istotna.
Największa różnica dotyczyła rytmu. Wiersze AI były oceniane jako mające znacznie lepszy rytm niż wiersze słynnych poetów (Cohen’s d = 0.847, co jest dużym efektem). Wszystkie pięć wierszy AI uzyskało wyższe oceny ogólnej jakości niż wszystkie pięć wierszy ludzkich.
Badacze proponują proste wyjaśnienie tego paradoksu: wiersze AI są bardziej przystępne. Komunikują emocje i tematy w sposób bardziej bezpośredni, łatwiejszy do zrozumienia. Uczestnicy 144 razy użyli zwrotów w stylu “nie ma sensu” opisując wiersze ludzkich poetów i tylko 29 razy przy wiersach AI. Dla nieekspertów złożoność Szekspira czy Plath wygląda na niespójność, a przejrzystość ChatGPT na talent.
Uprzedzenie działa w obie strony
Badanie ujawniło jeszcze jeden ciekawy mechanizm. Gdy uczestnikom powiedziano, że wiersz napisał człowiek, oceniali go wyżej. Gdy powiedziano, że wygenerował go AI, oceniali niżej. To samo dotyczyło wszystkich czternastu wymiarów jakości. Mamy więc do czynienia z podwójnym paradoksem: ludziom bardziej podobają się wiersze AI, ale jednocześnie mają uprzedzenie wobec AI jako autora.
Ten mechanizm wyjaśnia efekt “bardziej ludzki niż człowiek”. Uczestnicy zakładali, że lepszy wiersz musi być ludzki, bo przecież AI pisze gorzej (tak im się wydawało). Kiedy jednak badacze uwzględnili oceny jakościowe w modelu statystycznym, efekt autorstwa zniknął. To nie AI pisało “bardziej po ludzku”, to ludzie mylili prostotę z autentycznością.
A co jeśli AI nauczy się pisać jak konkretny autor?
Badanie z Nature dotyczyło poezji i ChatGPT 3.5, ale świeży preprint z SSRN (Chakrabarty, Ginsburg i Dhillon, 2026) poszedł znacznie dalej. Badacze wzięli nowsze modele: GPT-4o, Claude 3.5 Sonnet i Gemini 1.5 Pro, a zamiast poezji postawili na prozę literacką. Zadanie polegało na napisaniu fragmentu do 450 słów w stylu jednego z 50 uznanych autorów, w tym noblistów (Han Kang, Annie Ernaux), laureatów Bookera (Salman Rushdie, Margaret Atwood) i Pulitzera (Junot Díaz, Marilynne Robinson).
Oceniających podzielono na dwie grupy: 28 ekspertów z dyplomem MFA (Master of Fine Arts, odpowiednik doktoratu w dziedzinie twórczego pisarstwa) i 516 zwykłych czytelników z wykształceniem wyższym. Wyniki były fascynujące.
Przy zwykłym promptowaniu (“napisz fragment w stylu X”) eksperci MFA zdecydowanie woleli teksty ludzkie. Stosunek szans wynosił 0.13 dla jakości pisarstwa, co oznacza, że eksperci prawie 8-krotnie częściej wybierali ludzkiego autora. Ale zwykli czytelnicy już na tym etapie woleli AI (OR=1.82 dla jakości).
Prawdziwy przełom nastąpił po fine-tuningu, czyli dotrenowaniu modelu na pełnym dorobku danego autora. Nagle nawet eksperci MFA zaczęli preferować tekst AI: stosunek szans skoczył do 8.16 na korzyść AI w wierności stylowi i 1.87 w jakości. Zwykli czytelnicy preferowali AI jeszcze mocniej (OR=16.65 i 5.42). Detektory AI rozpoznawały fine-tunowane teksty zaledwie w 3% przypadków, w porównaniu z 97% dla zwykłego promptowania.
I jeszcze jedno: mediana kosztu fine-tuningu i generowania tekstu wynosiła 81 dolarów na autora. To 99.7% taniej niż wynagrodzenie profesjonalnego pisarza.
A co z codziennym pisaniem?
Pisałem kiedyś o tym, czy używanie treści ChatGPT jako własnych wypowiedzi jest w porządku. Argumentowałem wtedy, że w dyskusjach merytorycznych liczy się wartość argumentu, a nie to, kto go sformułował. Te dwa badania, wzięte razem, dostarczają twardych danych wspierających tę intuicję. Jeśli nawet w poezji i prozie literackiej ludzie nie potrafią odróżnić AI od człowieka (a często wolą AI), to co to mówi o codziennych e-mailach czy postach na LinkedIn?
Moim zdaniem mówi to, że granica między “ludzkim” a “maszynowym” tekstem jest w dużej mierze iluzją, a z czasem będzie się zacierać jeszcze bardziej. AI nie pisze po prostu “wystarczająco dobrze”. Pisze w sposób, który nieekspertom wydaje się lepszy, bo jest prostszy i czytelniejszy. A po fine-tuningu na dorobku konkretnego autora potrafi zmylić nawet ekspertów.
Jest w tym pewna ironia. Poeci i pisarze latami pracują nad złożonością i wieloznacznością swoich tekstów, a potem przychodzi model językowy, który pisze prosto i bezpośrednio, i czytelnicy wolą właśnie to. Wolą, bo jest bardziej dostępne, a nie “lepsze” w jakimkolwiek głębszym sensie. Nasze wyobrażenie o tym, jak “powinien” wyglądać dobry tekst, niekoniecznie pokrywa się z tym, co faktycznie lubimy czytać. Warto o tym pamiętać, zanim następnym razem ktoś z oburzeniem napisze na LinkedIn, że “kopiowanie z ChatGPT to oszustwo”.
Najczęściej czytane:
- Darmowe ogłoszenia o pracę i największa lista źródeł kandydatów – największa w Polsce lista bezpłatnych i płatnych źródeł kandydatów
- Praca w HR – najnowsze oferty pracy i aktualne średnie wynagrodzenia w branży HR
- Akademia Rekrutacji – zbiór wiedzy na temat rekrutacji oraz raporty z rynku pracy.
- Gowork – jak reagować na negatywne opinie o pracodawcach – Kompleksowy poradnik dla pracodawców.
- Jak napisać CV i profil LinkedIn – kompleksowy poradnik tworzenia CV i profilów LinkedIn
- RODO w rekrutacji – sourcing, direct search, ogłoszenia. Wszystko co musisz wiedzieć – kompleksowy poradnik RODO w rekrutacji z naciskiem na działania typu direct search / sourcing.
- Wszystko o systemach ATS – poradnik wyboru systemu rekrutacyjnego
- Umowy przedwstępne i listy intencyjne w procesach rekrutacyjnych – wszystko, co musisz wiedzieć o prawnych zabezpieczeniach zobowiązania do zatrudnienia.
Maciej Michalewski
Founder & CEO @ Element
Ostatnie wpisy:

Wiersze AI podobają się bardziej niż poezja Szekspira
Wiersze AI podobają się bardziej niż poezja Szekspira Wprowadzenie Badanie opublikowane w Scientific Reports (Nature) dostarczyło wyników, które powinny zainteresować każdego, kto uważa, że ludzką

Trzy narzędzia, które mierzą wpływ AI na rynek pracy
Trzy narzędzia, które mierzą wpływ AI na rynek pracy Wprowadzenie Dyskusja o wpływie AI na rynek pracy toczy się od lat, ale dopiero niedawno wyszła

Rynek pracy w Polsce: 238 tysięcy ofert i widmo jobless recovery
W lutym 2026 pracodawcy opublikowali 238 tys. ofert pracy – o 7% mniej niż rok temu. Analiza 69. edycji raportu Grant Thornton i komentarz CEO Element.

Rynek usług HR 2025 – co mówią dane z raportu PFHR
Polskie Forum HR opublikowało coroczny raport o kondycji rynku usług HR w Polsce. Element jest partnerem technologicznym PFHR, więc z podwójnym zainteresowaniem przyglądamy się tym

Nie widzę przyszłości dla MS Office
Trzy fazy przejścia od klikania w przyciski do poleceń AI. Dlaczego Microsoft Office jest skazany na wyginięcie i co go zastąpi.

Oferty rosną o 11%, a Dorsey tnie połowę firmy. Co się dzieje?
Oferty rosną o 11%, a Dorsey tnie połowę firmy. Co się dzieje? Wprowadzenie Dane, które mnie zaskoczyły Piszę o automatyzacji od lat. Uważam ją za