A tanulmány a digitális történelem és a mesterséges intelligencia kapcsolatait vizsgálja abból kiindulva, hogy a 21. századi technikai környezet hogyan változtatta meg és formálja jelenleg is a történészek munkáját. A témaválasztás jelentőségét az adja, hogy napjainkban egyre nagyobb teret nyer a különböző generatív AI eszközök alkalmazása. A tanulmány a legújabb nemzetközi szakirodalomra támaszkodva reflektál a digitális történelem és a mesterséges intelligencia történettudományra gyakorolt hatásaira, kitér a különböző alkalmazási területekre (például szövegbányászat), valamint rámutat azokra a kihívásokra, amiket technológiai fejlődés okoz a történészek számára. Végső soron a veszélyek és kockázatok figyelembevételével amellett érvel, hogy a digitális kutatási módszerek tökéletesítésével, a következetes forráskritika alkalmazásával, valamint a megfelelő kommunikációs stratégia fejlesztésével az AI vélhetően megkerülhetetlenné válik a történettudományi kutatásokban is. Kulcsszavak: digitális történelem, mesterséges intelligencia, történettudomány, digitális történelmi kutatás, ChatGPT, kihívások |
Bevezetés: „Minden ember a maga történésze” (?)
Lassan már egy évszázada annak, hogy Carl Lotus Becker az Amerikai Történelmi Társulat (American Historical Association) 1931. évi közgyűlésén elhangzott elnöki beszédében kifejtette a bevezetés címében idézett tézisét. A nem sokkal később önálló esszében is megfogalmazott gondolatmenetében amellett érvelt, hogy a történelem nem csupán objektív tények halmaza, hanem minden ember személyes tapasztalatainak és érdekeinek függvénye, vagyis minden ember csak azoknak a múltra vonatkozó információknak szentel figyelmet, amelyek relevánsak a számukra, ezért lényegében minden ember a saját történelmét (múltképét) teremti meg. Ebből Becker arra a megállapításra jutott, hogy a történészek szerepe leginkább az, hogy kutatásaikkal és munkáikkal egyfajta iránytűt adjanak az emberek kezébe azáltal, hogy megőrzik, értelmezik a múlt eseményeit, jelenségeit és folyamatait.[1]
Becker nem sejthette, hogy a 2020-as években a „minden ember a maga történésze” gondolat új értelmet nyerhet az egyre nagyobb teret nyerő digitalizáció, és újabban az ún. generatív mesterséges intelligencia (artificial intelligence, AI) eszközök egyre inkább elterjedt hétköznapi használata miatt. Ez olyan égető kérdéseket is felszínre hozhat, hogy valójában mi szükség van még a történészekre ilyen technikai lehetőségek között. Hiszen manapság már szinte bárki könnyedén hozzáférhet digitalizált formában az elsődleges és másodlagos források tömegéhez. Ráadásul szinte bárki számára elérhető az a technika is az olyan ún. nagy nyelvi modellek (large language models, LLM), mint például az Open AI Chat GPT algoritmusa révén, amelyek nemcsak választ (outputot) tudnak adni szinte bármilyen történelmi kérdésre, de a betaníthatóságuk miatt elemezni is képesek az elsődleges és másodlagos forrásokat. Másképpen szólva nemcsak a múlt értelmezését (vagy félreértelmezését) segítő források válnak egyre nagyobb mennyiségben online hozzáférhetővé, hanem – látszólag – az emberi-történészi szakértelem is egyre kevésbé (lesz?) szükséges ahhoz, hogy egy „átlagos” érdeklődő bármilyen, számára releváns múltra vonatkozó információhoz jusson, amivel így minden ember valóban a „maga történészévé” válhat.[2]
Meglehet, a felvetés rendkívül utópisztikusan hat, de talán érdemes belegondolnunk abba, ahogyan a társadalom egyre nagyobb mértékben támaszkodik a digitalizációra, illetve ahogyan igényli a kérdéseire az azonnali választ, úgy terjed az ezt megadni képes mesterséges intelligencia használata, vagyis úgy hárul egyre nagyobb szerep rá a történelmi értelmezésekben is. Ez így viszont már nem utópia – ez a jelen. És itt nem elsősorban arra gondolok, amit sokan legnagyobb veszélynek látnak az oktatás minden szintje és formája, így az egyetemi történelemképzés kapcsán, nevezetesen, hogy a tanulók/hallgatók valamelyik szöveggeneráló algoritmussal íratják meg a házi dolgozataikat vagy a diplomamunkáikat. A probléma sokkal inkább az, hogy ez a rohamos és látványos technikai fejlődés azt eredményezi-e, hogy mi, történészek egyre inkább olyan „csodabogarakká” válunk, akik fokozatosan elveszítik a kapcsolatot a társadalmi környezettel, és visszaszorulunk a maguk elefántcsonttornyaiba? Nézetem szerint nem, de ehhez a szakma nagyobb alkalmazkodására van szükség.
Mi, történészek ugyanis általában talán túl óvatosan és lassan reagálunk a változásokra, illetve az új kihívásokra. Ez alapvetően nem kritikai megjegyzés – egyszerűen ilyen a szakmánk természete. Ám a környezetünk jóval gyorsabb. Vélhetően az is kevéssé tudatosult bennünk, hogy a digitalizáció hogyan változtatta meg a munkánkat,[3] és máris a hétköznapi élet részévé vált valami új a generatív AI eszközök révén. Ezért olyan új fogalmakkal kell(ene) nekünk is megbarátkoznunk (inkább előbb, mint utóbb), mint a hatékony „promptolás” (prompting, kérdés vagy utasítás adása az AI eszköz számára), a chatbot (nagy nyelvi modell alapján működő csevegő) vagy neurális hálózatok (az ember számára már nem követhető összefüggések gépi reprezentációja). És mindezt úgy, hogy valójában azt a kérdést is át kell(ene) gondolnunk, hogy milyen a történész szakma jelene és jövője a digitális társadalomban.
A „digitális fordulat” alapvonásai
Természetesen a digitalizáció és a mesterséges intelligencia használatának terjedésére a történettudomány berkeiből is születtek már reakciók. Csak példaként említve, az elmúlt egy-két évben olyan neves folyóiratok, mint az American Historical Review, a History and Theory, a Geschichte und Gesellschaft vagy a Daedalus már teret adtak olyan tanulmányoknak, tematikus számoknak vagy rövidebb esszéket közlő fórumoknak, amelyek arra fókuszáltak, hogy ezek az eszközök hogyan változtatják (változtatták) meg a történészek munkáját. De hazai viszonylatban is megjelentek olyan gondolatébresztő és gyakorlati jellegű, módszertani munkák, amik konkrétan a történettudomány, vagy tágabban a bölcsészettudományok oldaláról vizsgálták a digitalizáció és a mesterséges intelligencia hatásait, illetve felhasználási lehetőségeit.[4] Megemlítem a nemrégiben általunk szerkesztett, elsősorban egyetemi történelem szakos hallgatóknak szánt módszertani tankönyvünket is, amiben több oldalt szenteltünk ezeknek a témáknak is.[5]
Nem titkoltan ezzel a mostani írással épp az az egyik célom, hogy többek között az említett neves folyóiratok lapjain nemrégiben megjelent elméleti és módszertani felvetésekre támaszkodva, illetve ezeket szemlézve kiegészítsem a módszertani tankönyvünk digitalizáció hatásait tárgyaló részeit, illetve a mesterséges intelligencia használatára vonatkozó ajánlásait. A másik célom pedig az, hogy reflektáljak arra a korábban megfogalmazott kérdésre, miszerint szükségtelen lesz-e a történész munkája, és a beckeri értelmezésen túl is „minden ember a maga történészévé” válik-e a (közel)jövőben a rohamos digitalizáció és AI eszközök révén.
Közhelyesen hangzik, de érdemes újfent hangsúlyozni, hogy önmagában már a digitalizáció is komoly változásokat okozott a történettudományban. Olyannyira, hogy a szakma képviselői közül többen már a történetírás újabb fordulataként értelmezik,[6] vagyis többnek tartják annál, hogy pusztán digitális eszközkezelésként tekintsenek rá. Ennek részét képezi az, hogy sokan felismerték: a „digitális történelem” a laikus, de érdeklődő közönség számára is lehetőséget teremtett arra, hogy a múlt megismerhetőbbé váljon számára. Számos példa igazolja, hogy erre határozott igény mutatkozik a történész szakmán kívül. Az egyik legszemléletesebb az, hogy 2002-ben, amikor Nagy-Britanniában online elérhetővé tették az első brit népszámlálás adatsorait, az adatbázis szinte azonnal összeomlott a hatalmas érdeklődés miatt (ami persze azt is mutatja, hogy az akkori online rendszerek még kevesebb terhelést bírtak el, mint napjainkban).[7]
Viszont a „digitális történelem” elterjedése ellenére viszonylag ritka az, hogy egy történész a saját történeti narratívájában teret adjon a digitális eszközök használatával kapcsolatos elméleti és módszertani megközelítéseinek is. Még inkább igaz ez a konkrét tapasztalatokra vonatkozóan. Egy egyszerű példával élve, a történészek nemigen szokták részletesen kifejteni azt, hogyan találják meg a számukra releváns forrásokat az Arcanum Digitális Tudománytár 54 millió oldalában, és még kevésbé azt, hogyan szelektálják, rendszerezik azokat, csak a már kinyert „találatokra” épülő narratívájukat interpretálják. Ez persze valahol érthető, hiszen a módszerek kifejtésére a terjedelmi korlátok sok esetben (például egy folyóiratban megjelenő tanulmánynál) nem adnak teret, és egyébként is gyakran egy kicsit eredménycentrikusan gondolkodunk, az eredményekhez vezető út apró részleteire pedig talán úgy tekintünk, hogy azok kevéssé lehetnek érdekesek az olvasóink számára.
Pedig nem csak a digitalizáció egyre jelentősebb elterjedése indokolhatja az ilyen szempontok boncolgatását. 2020-tól a Covid-19 járvány hatványozottan rákényszerítette a történészeket (is) arra, hogy a digitalizált és/vagy digitális forrásokra támaszkodjanak a munkájuk során.[8] A pandémia világszerte egyre jobban szükségessé tette, illetve felgyorsította a digitalizálást, és még inkább arra ösztönözte a szakma képviselőit, hogy munkájuk szerves részévé tegyék a rendelkezésre álló technikai eszközöket, valamint a digitális adatbázisokat.
Ennek ellenére az új kutatási eredmények kizárólag online, digitális formában történő terjesztésére még mindig bizonyos fenntartásokkal tekint a szakma. A publikálást illetően továbbra is a „papíralapú” gondolkodás dominál (hisz ki ne szeretné látni és kézbe venni a kutatásai eredményét önálló monográfia formájában vagy egy nyomtatott folyóiratban, tanulmánykötetben), sőt a lábjegyzeteinkben is elsősorban az ilyen publikációk hivatkozását preferáljuk. Ez nem feltétlenül csak magyar jelenség,[9] bár világviszonylatban egyre inkább elterjed a kiadói gyakorlatban az ebook formátum vagy az, hogy a kiadó csak annyi példányt nyomtat ki egy új kötetből, amennyit a szerző igényel (többnyire épp a szerző költségére, ami magyar szempontból borsos árú kiadást jelenthet).
A mindennapi gyakorlat során lépten nyomon tapasztaljuk, hogy a digitalizáció egyfelől felbecsülhetetlen előny, másfelől komoly kihívás is a szakmánk számára. Előny például azért, mert a források hozzáférhetőségének szélesedése lehetővé teszi, hogy nagyobb forrásbázissal dolgozzunk, illetve egyszerűbbé vált ennek feldolgozhatósága, kereshetősége, ami nemcsak időtakarékos lehet, de jelentősen megnöveli a hatékonyságot is. Ám a digitális források kezelése és hosszú távú megőrzése új kihívásokat is rejt. Az a közkeletű vélekedés, hogy ami online létezik, az megmarad, könnyen hamis biztonságérzetet adhat a kutatóknak, hiszen az adatok és fájlok törlődhetnek, elveszhetnek, sérülhetnek, illetve a szoftverek és hardverek rohamos fejlődése révén akár inkompatibilissé is válhatnak. Nem beszélve arról, hogy az adatgyűjtést, adatbázis-építést és digitalizálást végző intézmények, kutatóhelyek, kutatócsoportok nem feltétlenül állandóak, ami képlékennyé teheti a kutatási eredmények hosszú távú fennmaradását. Szinte biztosra veszem, hogy a szakmát hosszú évek-évtizedek óta ismerők mindegyike tud legalább egy olyan kutatót vagy kutatócsoportot, aki vagy amely hosszú időt, energiát és pénzt fektetett egy forrásgyűjtő munkába vagy adatbázis-építésbe, ám a kutatás befejezése után az értékes eredmények csak korlátozottan lettek hozzáférhetők, vagy idővel teljesen el is tűntek a történettudomány művelőinek szeme elől. Végső soron az sem mellékes, hogy maga a digitalizálás (pontosabban az, hogy mely forráscsoportokra kerül sor a digitalizálás során) szakmai, anyagi és olykor (tudomány)politikai döntés eredménye is lehet, ami nagyban befolyásolhatja a történészeket abban, hogy mely témák felé összpontosítják a figyelmüket.[10] Ezért bizonyos források digitalizálása, illetve más források digitalizálásának elmaradása döntő hatást gyakorolhat arra, hogy a történészek mit kutatnak, illetve milyen múltra vonatkozó kérdéseket tesznek fel.[11]
Ebből persze nem következik az, hogy a történészek ma már csak digitalizált forrásokat használnak, vagy fognak használni a közeljövőben. De lássuk be, a digitalizált forrásbőség következtében akarva-akaratlanul, illetve tudatosan vagy látens módon szinte minden történész többé-kevésbé újraértelmezte a történeti kutatásainak gyakorlatát, hiszen megváltoztak az olvasási szokásaink és a forrásfeldolgozási módszereink. Noha a digitális kutatás (még?) nem váltja ki teljesen a „hagyományos”, „analóg” kutatást, szép lassan „áthangolódott” a munkánk. Ám másik oldalról nem árt arra is emlékeztetni, hogy a digitalizált forrásokat tartalmazó adatbázisok jelentős része csak fizetős hozzáféréssel érhető el. Ez pedig azért különösen fontos, mert nemcsak behatárolhatja a történészek munkáját, de mélyítheti a közöttük lévő egyenlőtlenségeket akár országon belül, akár nemzetközi összevetésben. Vagyis konkretizálva: akik számára például a munkahelyük vagy pályázati forrásaik lehetővé teszik, kiaknázhatják az ilyen adatbázisokban rejlő lehetőségeket, míg mások ezek hiányában szinte ledolgozhatatlan szakmai hátrányba kerülhetnek.[12]
Ugyanakkor érdemes tudatosítani, hogy a forrásbőség veszélyeket is tartogat. Ugyanis ezáltal a történész (különösen a pályakezdő) olyan szövevényes rengetegben találhatja magát, ahonnan nem fogja látni a kiutat, és a kutatása – témától függően – szinte parttalanná válhat, de legalábbis megnehezítheti az eredményességet.[13] Hadd érzékeltessem ezt egy személyes példával. Lassan 15 éve, 2009-ben védtem meg a Turul Szövetség történetéről szóló doktori értekezésemet, az ebből készült könyv néhány évvel később, 2012-ben jelent meg. Ezek a dátumok azért fontosak, mert mindezekre a már említett Arcanum Digitális Tudománytár megjelenése előtt került sor. Az ADT 2014-ben indult útjára, és 2024. januári állapot szerint 54 731 473 oldal digitalizált forrást tartalmaz. E sorok írásakor „Turul Szövetség” keresőkifejezéssel elindítottam egy 1919. augusztus 1. és 1944. december 31. közötti intervallumra szűkített teljes szövegű keresést, aminek eredménye 16 129 találat lett. Kis túlzással szinte bármelyik találat esély lehet arra, hogy új, eddig fel nem tárt információt találjunk a Turul Szövetség történetére vonatkozóan. Csak ezek szisztematikus feldolgozása, szelektálása, rendszerezése hónapokat venne igénybe, ha egy kutató most kezdene a szervezet történetének újraírásába. És ezek csak a téma (korántsem teljes) sajtóforrásai. Másképpen szólva a digitalizálás üteme olyan mértékű, hogy szembe kell néznünk és meg kell békülnünk azzal a ténnyel, hogy – a digitális kutatás módszertanával behatóan foglalkozó már idézett Bob Nicholson szavaival: „… létfontosságú új dokumentumok jelenhetnek meg az interneten a következő havi frissítésekben, vagy, ami még rosszabb, hogy egy újonnan digitalizált forrás végzetesen alááshatja egyik cikkünket a megjelenés utáni héten”.[14]
Megkockáztatható továbbá az az állítás is, hogy eljutottunk arra a pontra, ahol a digitalizáció nem biztos, hogy minden esetben időt takarít meg a kutató számára, hanem épp ellenkezőleg, időigényesebbé teheti az anyaggyűjtést. Vagyis új szakmai kihívássá lépett elő a releváns információ azonosítása a forrásbőségben. Félreértés ne essék, nem állítom, hogy a digitalizáció által okozott „forrás-Kánaán” hátrányt jelentene a történettudomány számára. Sőt meggyőződésem, hogy az ADT és a hozzá hasonló adatbázisok nélkül sokszor csak tűt keresnénk a szénakazalban, vagy bizonyos forrásokhoz sosem férnénk hozzá. Csak azt kívántam szemléltetni, mennyire átgondolt, pontosabban mennyire másképp átgondolt tervezést igényel ma már egy történeti kutatás, mint – mondjuk – egy évtizeddel ezelőtt.
Az információbőség nem csak az elsődleges források esetében jelent kihívást, hanem a másodlagos források, vagyis a szakirodalom keresésében és feldolgozásában is. Olyan információbankok, mint például a JSTOR és más hasonló adatbázisok révén már az 1990-es évek közepe óta tömegével férhetünk hozzá a nemzetközi szakirodalomhoz (leggyakrabban persze egyéni vagy intézményi előfizetés útján). A 2000-es évek második felében ezt még inkább megkönnyítette az optikai karakterfelismerés (optical character recognition, OCR) és más adatbázisok (például a Google Books) elterjedése,[15] ezek együtt pedig – csakúgy, mint a forrásgyűjtés esetében – a szakirodalom-keresésre fordított időmennyiség változását eredményezték.
Ám ez felvet egy újabb döntő kérdést különösen a történészek számára, akiknek a célja a múlt minél mélyebb és szélesebb körű értelmezése: hol húzzák meg a vonalat, hogy most már elég a forrásgyűjtésből? Hiszen ne feledjük, nem csak össze kell gyűjteni a forrásokat, azokat szisztematikusan fel kell dolgozni, értelmezni kell, és egy koherens, logikus narratívát kellene alkotni belőlük (vagy általuk). Az elsődleges és másodlagos források eddig soha nem látott mennyisége és hozzáférhetősége nemcsak felértékeli a szelekció jelentőségét, de sok történész számára a kutatómunka nehezebbé válását eredményezheti. Gondoljunk például arra, hogy nem mindenki rendelkezik a modern eszközök hatékony használatához szükséges készségekkel és kompetenciákkal (és itt nem feltétlenül csak az idősebb generációkra gondolok, a fiatalok között sem feltétlenül mindenki esetében kézenfekvő, hogy megfelelően tudják használni például a digitalizált forrásokat tartalmazó adatbázisokat). Pedig ezek különösen fontossá váltak a történészszakma művelése kapcsán is. Nem nehéz belátni, hogy a digitális módszerek bőven egyenrangúvá váltak a „hagyományosakkal” (sőt részben vagy teljes egészében fel is váltották azokat), és a történész eredményességének kulcsa az lett, hogy mennyire képes kreatívan használni a modern eszközöket a saját kutatói céljai érdekében. Más szóval – hangsúlyozva azt, amit a már idézett újabb szakirodalom is kiemel – az online kutatás, a megfelelő keresőszavak megtalálása alapvető készséggé vált a modern történettudományban.[16] Vagyis akkor indulunk el jó irányba, ha az egyetemi történész- (és történelemtanári!) képzésünkben minél nagyobb hangsúlyt fektetünk a digitális kompetenciák fejlesztésére.
Ez nyitott kapun való dörömbölésnek tűnhet, de talán annak fényében mégsem lehet eléggé hangsúlyozni, hogy a modern karakterfelismerő digitalizálásban bőven előfordulhatnak hibák, amik jelentősen befolyásolhatják a keresési találatokat. A korábbi példánál, az ADT-nél maradva bizonyára már sokan tapasztalták a digitalizált sajtóforrások böngészésekor az egyenetlenül eloszló fényerősségből adódó szövegtorzulást, az átfutást (a digitalizált lap másik oldaláról átütő karakterek), a dokumentum szkennelésének ferde tájolását vagy a szöveget eltakaró pacákat, nem beszélve azokról a nyomdahibákról, amiket eleve az újság nyomtatásakor ejtettek. Ezek mind befolyásolhatják a keresési eredményeket,[17] amit a kutatónak figyelembe kell vennie. Az utóbbi időben már több izgalmas módszertani munka napvilágot látott a digitalizált források (például a sajtóforrások)[18] felhasználási lehetőségeiről, beleértve a keresési metódusokat, a szövegbányászatot és az előforduló hibák kiküszöbölését, de nem járunk messze az igazságtól, ha azt állítjuk, hogy a történészek még csak a felszínét kapargatták meg annak, amit ez a „forrás-Eldorádó” nyújthat a számukra.[19]
Mesterséges intelligencia mint új lehetőség
Túlzás nélkül kijelenthető, hogy a 21. században a digitalizáció miatt tapasztalható forrásbőség következtében – Wulf Kansteiner német történész találó kifejezését használva – a történészek „forrásokkal folytatott kreatív küzdelmei” (creative struggles with sources)[20] merőben új szakaszba léptek. És alig, hogy kezdtünk hozzászokni ehhez a helyzethez, máris érkezett valami új, az ún. mesterséges intelligencia, [21] ami szintén egyszerre lehetőség és kihívás a szakmánk számára (is).
Nem véletlen, hogy a történettudomány egyik nemzetközileg elismert folyóirata, a History and Theory már 2022 végén több tanulmányt szánt annak a problémakörnek, hogy a mesterséges intelligencia hogyan változtat(hat)ja meg a történészek munkáját. A szerzők között volt olyan, mint Marnie Hughes-Warrington ausztrál történész, aki azzal érvelt, hogy bár ezeknek az eszközöknek a „hétköznapi” használata leginkább a jelen- és jövőorientált problémák megoldására irányul, ezek az algoritmusok valójában rendkívül szoros kapcsolatban állnak a múlttal. Hiszen „az általuk feldolgozott adatok a múltból származhatnak, vagy a múltra utalhatnak”, ezért a mesterséges intelligenciát immár egyfajta történeti diszciplínaként kellene felfognunk.[22]
Hasonló álláspontot képviselt a szerzők között a már idézett Wulf Kansteiner is. Szerinte a történészeknek azért kell belépniük a „mesterséges intelligencia világába”, mert a munkájuk alapvetően szövegközpontú, és a mesterséges intelligenciával kapcsolatos újabb áttörések épp a szöveggenerálás terén történtek, ami „új lehetőségeket nyit meg a történeti kutatás és a történelemtanítás előtt, és valószínűleg a tudományág jövőjét is formálni fogja”.[23] Sőt, Kansteiner még ennél is továbbment akkor, amikor a történész munkáját a mesterséges intelligencia működéséhez hasonlította. „Úgy tűnik”, jelentette ki, „természetes rokonság van a mesterséges intelligencia legfejlettebb formái és a történelemtudomány között. Mindkettő különös vonzalmat mutat a szabályok, a kiszámíthatóság és az írott szó iránt”. Ebből pedig azt a következtetést szűrte le, hogy a nagy nyelvi modellekhez hasonlóan „a történészek is arról írnak, amit valahol máshol olvastak, de a döntő különbség az, hogy a történészek megpróbálják nyomon követni a »valahol másholt«”.[24]
A nyomon követés problémájára hamarosan még utalni fogok, de addig érdemes elidőznünk a történész munkája és a mesterséges intelligencia működése közötti hasonlóságnál. Ezt a gondolatot ugyanis mások is megfogalmazták. Az American Historical Review 2023. évi harmadik számának History Lab fóruma történészek és nem történészek olyan esszéinek adott teret, amelyek a mesterséges intelligencia algoritmusok történettudományi alkalmazásának különböző aspektusait vizsgálták. A panel bevezetőjének szerzői egyértelműen úgy látják, hogy napjainkban és a jövőben a mesterséges intelligencia kisebb-nagyobb mértékben minden történeti kutatást alakítani fog, ezért a történészeknek (is) alkalmazkodniuk kell a változó környezethez. Érvelésük szerint „ahogy egyre több történelmi forrás kerül digitális formátumba, akár digitalizálási folyamatok, akár eleve digitális eszközök által, a gépi tanuló algoritmusok a történelmi kutatások elvégzéséhez szükséges eszközzé válnak. Más szóval a mesterséges intelligencia mind a társadalmi tevékenységet, mind a történeti munkát befolyásolja, és ezáltal összeolvad a történelmi tudattal.” Végül arra a megállapításra jutottak, hogy „a mesterséges intelligenciát övező társadalmi, technikai, politikai és metafizikai körülmények olyan gyors ütemben, olyan mélyreható hatásokkal és olyan léptékben fejlődnek, hogy ha most nem gondolkodunk el azon, hogy ezek a változások milyen hatással lesznek a szakmára, akkor lehet, hogy már túl késő lesz annak alakításához, hogy hogyan őrizzük meg, vizsgáljuk és értelmezzük azt a világot, amelyben a mesterséges intelligencia egyszerre a tanulmányozást lehetővé tevő eszköz és a változások erőteljes előidézője”.[25]
A fórum szerzői közül Joshua Sternfeld amerikai történész érvelt markánsan a történész munkája és a mesterséges intelligencia működése közötti hasonlóság mellett, sőt nézete szerint a mesterséges intelligencia valójában már most szinte történészként (AI-as-Historian) funkcionál. „Minél jobban megvizsgáljuk a mesterséges intelligencia tanulási folyamatát, annál inkább kezd hasonlítani a történelemíráshoz”, fogalmazott, majd az álláspontját azzal támasztotta alá, hogy az AI algoritmusok „a történészekhez hasonlóan történelmi adatokat gyűjtenek, osztályozzák, elemzik, értelmezik és tárolják azokat a későbbi felhasználás érdekében. Ez a bonyolult tevékenységsorozat nem történhet meg a történelmi tudatosság nélkül, amely az emlékezetre, a kritikai elemzésre, az adatok kontextualizálására és a kauzalitás elméletére támaszkodik.”. Ezért Sternfeld – talán némiképp túlidealizálva az AI lehetőségeit és szerepét – úgy véli, a mesterséges intelligencia rendelkezik a múlt újraértelmezésének képességével, és „a történészek és a mesterséges intelligencia egyaránt úgy manővereznek a bizonytalanságon belül, hogy elfogadják, bármennyire is hatalmas mennyiségű adat áll rendelkezésre, a múlt modellje nem lesz teljes, mivel a teljes bizonyító erejű forrás elérhetetlen”.[26]
Tehát ha ezeket az értelmezéseket nézzük, akkor a mesterséges intelligencia használata révén – látszólag – valóban „minden ember a maga történészévé” válhat, pontosabban mindenkinek a számítógépén vagy okostelefonján ott lapul az a személyre szabható privát „történész-segéd”, amely elősegítheti a saját múltkép azonnali alakítását – az „emberi” történész hozzájárulása nélkül. Jogosan merül fel a kérdés, hogy az idézett történészek miért ennyire optimisták a mesterséges intelligencia történeti „gondolkodásával” kapcsolatban?
Egyfelől azért, mert az AI eszközök rendelkeznek olyan „képességgel”, amivel az eddigi keresési módszereink nem. Arra gondolok, hogy amikor beírunk egy keresőkifejezést (önálló szót, csillaggal kiegészített szótöredéket, több szót idézőjelek között stb.) egy adatbázis (például a már többször említett ADT) keresőjébe, akkor a keresőmotor pontosan csak ezt a kifejezést keresi a gyűjteményben. Ezzel szemben a mesterséges intelligencia eszközök a gépi tanulási modellek által meghatározott hasonló szavak, ötletek és fogalmak alapján adnak vissza eredményeket – ráadásul koherens szöveg formájában. Mindezt úgy, hogy az AI algoritmusok „megláthatnak” olyan összefüggéseket, amiket az ember a nagy adatmennyiség miatt nem képes.[27] Ennek azért van különös jelentősége, mert érdemes emlékeztetünk magunkat arra, hogy a „bigdata” és a forrásbőség, ebből következően a történeti tudás folyamatosan halmozódik, nemcsak az újabb és újabb digitalizálás következtében, hanem azért is, mert a történészek által felhasználandó más szövegek (például a szakirodalom) közül egyre több eleve csak digitális formában születik meg.[28]
Másfelől pedig azért tapasztalható ez a történészi optimizmus, mert a mesterséges intelligencia valójában számos területen alkalmazható, ami által a múlt (ismét hangsúlyozandó: látszólag) még jobban megismerhetővé válhat. Az alkalmazási területekről „megkérdeztem” a „legilletékesebb” érintettet, az OpenAI ChatGPT ingyenesen elérhető 3.5-ös verzióját. Egészen pontosan a következő promptot adtam meg számára: „Arra vagyok kíváncsi, a történészek hogyan használhatnák kreatívan a különböző mesterséges intelligencia algoritmusokat. Kérlek, a válaszod során vedd figyelembe, hogy én is történész vagyok, ezért nem a laikusoknak szánt általános szempontok érdekelnek, hanem a valóban specifikus, történettudományi alkalmazási lehetőségek.” Azért tartottam fontosnak teljes egészében idézni ezt, mert érzékeltetni szerettem volna egy – nézetem szerint – kulcsfontosságú tényezőt: a mesterséges intelligencia használatának kulcsa valójában a sajátos kommunikációs stratégia. Vagyis az algoritmusok nem gondolatolvasók, még a példámhoz képest is alaposabban körülírt promptra (sőt leggyakrabban nem csak egyre, hanem többször át- és újrafogalmazott promptokra) lehet szükség ahhoz, hogy a felhasználó megkapja azt a választ, eredményt, amire szüksége van.
Válaszként a ChatGPT összesen nyolc olyan specifikus területet jelölt meg, ahol az AI kreatívan felhasználható történettudományi vizsgálatok esetében. Ezek a következők:
„Adatbányászat és Archiválás:
Az AI alkalmazása segíthet az óriási mennyiségű történelmi dokumentumok, levelek, naplók és egyéb források átvizsgálásában. Kifejlett adatbányászati algoritmusok lehetővé teszik a releváns információk gyorsabb és hatékonyabb kinyerését, segítve a történészeket a kutatásban.
Automatizált Tartalomértelmezés:
Az AI segíthet a történelmi dokumentumok tartalmának automatizált értelmezésében és kategorizálásában. Például egy olyan algoritmus, amely azonosítja az események időpontját, helyszínét, résztvevőit és témáját, elősegítheti a gyorsabb adatfeldolgozást.
Nyelvi Elemzés és Stílus Felismerés:
Az AI alkalmazása segíthet a történelmi szövegek stílusának és nyelvének elemzésében. Ez lehetővé teszi a különböző időszakok vagy szerzők stílusának azonosítását, és hozzájárulhat a források pontosabb datálásához vagy azok szerzőjének azonosításához.
Időszakos Tendenciák Elemzése:
Mesterséges intelligencia alapú eszközökkel lehetőség nyílik a történelmi események és trendek elemzésére az időben. Ez segíthet a történészeknek abban, hogy átfogóbb képet alkothassanak a társadalmi változásokról és azok hátteréről.
Digitális Rekonstrukció és Virtuális Valóság:
Az AI támogathatja a történelmi helyszínek vagy események virtuális rekonstrukcióját. Ez lehetővé teszi a történészek számára, hogy interaktív módon vizsgálják meg a múltat, és a tanulók számára egyedi élményeket teremtsenek.
Kép- és Hangfeldolgozás:
Az AI segíthet a történészeknek az archivált képek és hanganyagok elemzésében. Az automatizált képfelismerés és hangfeldolgozás lehetővé teszi az érzékeny információk gyorsabb azonosítását és kiemelését.
Történeti Szimulációk és Predikciók:
Mesterséges intelligencia algoritmusokkal lehetőség nyílik a múltbeli események alapján történő szimulációk és predikciók készítésére. Ez segíthet a történészeknek megérteni a történelem lehetséges forgatókönyveit és következményeit.”[29]
Ha végigtekintjük ezt a felsorolást, talán kissé idegenül vagy futurisztikusan hat, különösen Magyarországról nézve. Ez persze nem meglepő, hiszen olyan, számunkra szokatlan módszerekről, megközelítésekről van szó, amik közül igen kevésre akad hazai példa. Ennek az elsődleges oka az, hogy ezek között több olyat találhatunk, ami nemcsak sajátos gondolkodásmódot igényel, hanem olyan speciális informatikai ismereteket is, amiket még el kell(ene) sajátítanunk. Ilyen például a ChatGPT által az első pontokban említett adat- és szövegbányászat (illetve az erre épülő adatvizualizáció).[30] Holott éppen ezek a módszerek lehetnek azok, amelyek a digitalizáció okozta korábbiakban ecsetelt forrásbőség kezelését elősegíthetik. Még akkor is, ha ez sem csodaszer, és a nagy szövegkorpuszok adatként történő értelmezése félrevehető lehet, vagyis a túlzott kvantifikációban elveszhet a „milyenség” és az egyediség, amire a történészek előszeretettel szokták a figyelmüket fordítani.[31]
A ChatGPT idézett válaszában olyan elem is megtalálható, amelyet idehaza általában kétkedéssel utasítanak el, mint az utolsó pontban említett „lehetséges forgatókönyvek” értelmezése, ami a történettudomány kevésbé elterjedt válfajára, a kontrafaktuális történetírásra utal. Azonban az információ-feldolgozás sebessége, léptéke és mennyisége mellett valójában épp a virtuális valóság és a különböző hipotézisek, illetve „lehetséges forgatókönyvek” tesztelése lehet a (közel)jövőben a történettudomány (egyik) értékes új fejleménye. Vagyis a mesterséges intelligencia újabb lendületet adhat a kontrafaktuális történetírásnak, sőt akár nagyobb legitimációt is eredményezhet számára a történettudományon belül.[32] Tehát minden kétkedés ellenére ezek a ChatGPT által megjelölt szempontok és módszerek valóban újszerű eredményekkel kecsegtető lehetőségek. Persze ezek megfelelő kiaknázásának feltétele nemcsak az erre alkalmas módszertan történészek általi kidolgozása és elsajátítása, hanem az is, hogy a szakma képviselői megnyugtató válaszokat tudjanak adni az AI jelentette kihívásokra.
Mesterséges intelligencia mint új kihívás
A szakmán belül nem csak optimista gondolatok fogalmazódtak meg a mesterséges intelligencia használatával és elterjedésével kapcsolatban. „Maga” a ChatGPT is „diplomatikusan” utal az aggályokra a korábban idézett válaszában, amit ezzel zárt: „Az AI alkalmazása a történettudományban tehát rendkívül sokoldalú, és számos területen hozzáadott értéket jelenthet a kutatáshoz és oktatáshoz is. Azonban fontos, hogy az ilyen rendszereket etikai szempontokat figyelembe véve alkalmazzuk, és a mesterséges intelligencia eredményeit mindig kritikusan értelmezzük a történettudomány specifikus kontextusában.”[33]
Mik lehetnek ezek az aggályok és etikai szempontok? Ezek egyike a magánélet és az érzékeny adatok védelme. A mesterséges intelligenciával kapcsolatos általános társadalmi bizalmatlanság oka gyakran éppen az, hogy sok felhasználó nem (feltétlenül) érzi magát, illetve saját adatait biztonságban az ilyen algoritmusok használata során. Továbbá hiányzik belőlük az etikai önreflexivitás, vagyis könnyen adhatnak olyan válaszokat egy-egy promptra, amik mások (például mások, még élő személyek vagy már elhunytak leszármazottjainak) érzékenységét sérthetik.[34]
A bizalmatlanság problémájához szervesen hozzátartozik, hogy a felhasználók jelentős többsége nem tudja, hogyan működnek ezek az eszközök, hogyan konstruálják meg a válaszaikat, hogyan valósul meg a betanításuk stb. Ez az átláthatóság éppen a potenciálisan diszkriminatív válaszok miatt is fontos lenne. A már többször idézett Kansteiner mutatott rá arra, hogy a mesterséges intelligencia eszközök valójában képtelenek az „igazságot” megmondani, pontosabban nem tudják megkülönböztetni a valóságot és a lehetséges torzításokat, amiket a források tartalmazhatnak. Ahogy ő fogalmazott, a nagy nyelvi modellek képesek lehetnek Ranke stílusában írni, de nem tudnak úgy gondolkodni, mint Ranke – vagyis forráskritikával. Tehát ha például bármelyik nagy nyelvi modell betanításához használt szövegkorpusz látens strukturális előítéletek tartalmaz (a nőkkel vagy etnikai csoportokkal szemben), akkor a nyelvi modell szöveges outputjai (válaszai) is visszaadhatják ezeket.[35]
Ehhez hasonlóan komoly etikai aggály az, hogy az AI algoritmusok olykor túlzottan „kreatívak” lehetnek, ha arra kérdezünk rá, hogy milyen forrásból származnak az általuk válaszként közölt információk. Gyakran egyszerűen „kitalálnak” meggyőzőnek tűnő linkeket, fiktív tanulmány-, folyóirat és könyvcímeket, szerzőket, de akár történészek közötti vitákat (!) is, amivel nemcsak az a baj, hogy félrevezető, hanem az is, hogy (különösen a tapasztalatlan felhasználók esetében) rendkívül időigényes ezek valódiságának ellenőrzése. Egy amerikai blogbejegyzést említek példaként. Ennek szerzője a nagybátyja után szeretett volna kutatni, aki a második világháború idején a csendes-óceáni hadszíntéren teljesített szolgálatot. Arra kérte a ChatGPT-t, hogy soroljon fel 20 releváns forrást, amiket az algoritmus pillanatok alatt megadott neki. Majd a kutató véletlenszerűen kiválasztott ezek közül négyet, és azt kérdezte meg a ChatGPT-től, hogy hol találhatja meg ezeket, mire az eszköz minden esetben „bevallotta”, hogy csak ő „találta ki” a forrásokat.[36] Ehhez hasonló történeteket bőven lehet találni más blogokon is. Ennek a problémának a jelentősége abban a kínzó kérdésben összpontosul, hogy ha az ilyen – úgymond – „egyszerű” promptok esetében nem pozitív értelemben „kreatív” a mesterséges intelligencia, akkor mennyire bízhatunk a válaszaiban az összetettebb problémamegoldások esetén? Valójában épp az ilyen esetek bizonyítják, hogy az AI jelenlegi formájában még nem mindenre megoldás, sőt komoly kritikával kell kezelni a szöveges outputjait.
Mindez azért lényeges, mert egy 2022-ben megjelent tanulmány szerint az akkori ChatGPT 3-as verziója napi 4,5 milliárd (!) szót „termelt”,[37] és ne legyen kétségünk afelől, hogy ez a szám 2024-ben még magasabb lesz. Ebből pedig egyenesen következik az, hogy a nagy nyelvi modellek az „információs ökoszisztémánk állandó szennyezését fogják okozni nagy mennyiségű, nagyon hihető, de gyakran valótlan szöveggel”.[38] (Hozzátehetjük, ugyanez érvényes az AI-generált képi és audiovizuális tartalmakra is.) Ám a történettudomány számára (de más tudomány számára is) épp a nyomon követés, vagyis a leírt állítások igazolhatósága és a visszakereshetősége az egyik legfontosabb tényező, amiről a korábbiakban már volt szó.
A probléma azonban nemcsak a valótlan információkat tartalmazó outputok esetében áll fenn: a nagy nyelvi modellek sosem adnak kétszer teljesen ugyanolyan választ egy promptra. Pontosabban tartalmilag lehet hasonló az output, de szó szerint nem fog megegyezni. Érdemes kipróbálnia az olvasónak azt, hogy az általam beírt promptot maga is megadja a ChatGPT számára: vagy a sorrend lesz más, vagy a megfogalmazás, esetleg a tartalmi elemek közül sem adja vissza mindegyiket az algoritmus, de újakkal is kiegészítheti. (Azt a kísérletet sem lenne haszontalan elvégezni, hogy két felhasználó, két különböző fiókba bejelentkezve egy időben szó szerint ugyanazt a promptot adja meg az algoritmus számára, majd a kapott outputokat összevetik.) Vagyis én hiába hivatkoztam meg a ChatGPT válaszát egy lábjegyzetben, mert ha az olvasó reprodukálni akarja a szöveget (vagyis újra meg akarja nézni „eredetiben” a forrást), akkor nem fog sikerrel járni, tehát vagy elhiszi nekem, hogy ez volt az algoritmus válasza, vagy nem (valószínűleg a legszakszerűbb idézés az lenne, ha képernyőképeket is elhelyezünk a szövegeinkbe, ahol az AI válaszaira utalunk).[39]
Ez pedig – nem alaptalanul – alááshatja a leírt szövegek megbízhatóságát. Épp ezért érthető, ha a szakma képviselői között sokan rendkívül óvatosak a mesterséges intelligencia algoritmusok tudományos felhasználása, pontosabban a felhasználás szakmai publikációban való feltüntetésével szemben. Az eddigiekben felvillantott valós aggályok mellett ez az óvatosság abból a félelemből is adódik, hogy az AI feltüntetésével a produktum önállósága – látszólag – csorbulhat, vagy legalábbis a befektetett tudományos munka értéke csökkenhet. Ez a felfogás tulajdonképpen a történészi „beidegződéseink” eredménye. Az eddigiekben felvillantott tényezők pedig összességében arra intenek, hogy továbbra is fenntartásokkal kezeljük azt, hogy a mesterséges intelligenciát bárki a privát „történész-segédjének tekintse”, de legalábbis innen nézve nem értük még el azt, hogy az AI révén tényleg „mindenki a maga történészévé” válhat.
Összegzés: digitalizáció és mesterséges intelligencia a történettudomány mérlegén
Az aggályok és etikai problémák ellenére nem javasolnám, hogy a történész szakma képviselői zárkózzanak el az AI használatától, illetve a használat tudományos publikációkban való feltüntetésétől. Az első rész – vagyis a használat – kicsit az internetes keresőmotorok elterjedésére emlékeztet: akkor ezek új eszközök voltak, amikkel gyorsan el lehetett jutni a számunkra megfelelő információhoz, és gondoljuk meg: senki sem tüntette fel a lábjegyzetekben, hogy ahhoz a hivatkozott forráshoz valamilyen keresőmotor vagy valamely könyvtár „hagyományos” kézi cédulakatalógusának segítségével jutott el. A mesterséges intelligencia ugyanígy egy eszköz, a különbség viszont az, hogy nemcsak „megmutathatja” nekünk a forrást (már persze ami valós, és nem általa kitalált), hanem új szövegeket is generálhat (kérdés persze, hogy valóban újak-e ezek a szövegek). Továbbá bizonyos algoritmusok (mint például a ChatPDF, a PDF.ai vagy a scite.ai) képesek ezeket „elolvasni” és kivonatolni a számunkra, sőt arra is, hogy ezek alapján ötleteket fogalmazzanak meg, összefüggésekre mutassanak rá, vagy akár javítsák az általunk megírt szövegeket. Vagyis a korábbi egyszerű és összetett kereséshez képest a történettudományi kutatások új dimenzióját nyithatják meg – a hatékony kommunikációs stratégia és az új lehetőségekhez való megfelelő alkalmazkodás függvényében.
Az etikus eljárás az lenne, ha mindezek (promptok, generált szövegek stb.) szakszerű hivatkozások formájában meg is jelennének a történettudományi szakmunkákban. Különösen a pályakezdők esetében lehet ez releváns, mert az AI használatának elhallgatása könnyen sajátos kellemetlen „imposztor-szindrómás” szituációkat eredményezhet. Másik oldalról viszont az sem sűrűn fordul elő, hogy egy szerző a szövegében feltünteti, ha valakivel elolvastatta, stilizáltatta a szövegét, vagy véleményt kért azzal kapcsolatban, vagyis ugyanazt a munkát végeztette el vele, mint a mesterséges intelligenciával (noha kétségtelen, hogy az utóbbi gyorsabb, bármikor „ráér”, és hatékonyabb lehet). Érdemes tehát szembenézni azzal, hogy az AI terjedésének következtében – kénytelen-kelletlen – újragondolásra szorulhatnak olyan fogalmak, mint az „önálló kutatás” és az „önálló szövegalkotás”.
Összességében a digitalizáció és a mesterséges intelligencia egyre inkább hétköznapivá válása felelős, etikailag tudatos, a lehetőségeket kiaknázó, a kihívásokra reagáló gondolkodást, a szakmai paradigmáink átértékelését és új kutatói-kommunikációs stratégiát tesz szükségessé a történettudomány területén is. Konkrétabban megfogalmazva a legjelentősebb kihívást: a digitalizáció révén kialakult, széles körben hozzáférhető forrásbőség és a szintén széles körben hozzáférhető mesterséges intelligencia, pontosabban a generált tartalmak könnyen befolyásolhatják a kollektív emlékezetet és általában a társadalom múlthoz való viszonyát. Vagyis minden ember úgy lehet a „maga kvázi-történésze”, hogy valójában már nem pusztán arról van szó, hogy azoknak a múltra vonatkozó információknak szentelnek figyelmet, amelyek relevánsak a számukra, hanem arról is, hogy ezek az információk egy torzító „szűrőn” keresztül juthatnak el hozzájuk, ami a múlttal való kapcsolatok további halványulását eredményezhetik. Másképpen szólva, hiába a forrásbőség és az ezt kezelni képes mesterséges intelligencia, ha mindehhez a „laikus” társadalom kritikátlan bizalommal viszonyul.
A szakszerű értelmezés nélküli AI által generált történeti „tudás” ezáltal valójában illuzórikus lehet, pontosabban – Eli Pariser kifejezésével élve – „szűrőbuborékon” (filter bubble)[40] keresztül jut el az emberekhez. A „szűrőbuborék” kifejezés azt a jelenséget jelöli, amit olyan webhelyek (akár mesterséges intelligencia eszközök) algoritmusai generálnak, amelyek a felhasználók korábbi böngészési adatai alapján kiszűrik az őket érdeklő információkat, és ezekhez hasonlókat kínálnak számukra. Vagyis a felhasználók ezáltal csak azokkal az információkkal találkoznak, amelyek alátámasztják a saját nézőpontjukat, véleményüket, ez pedig a napjainkban és a (közel)jövőben tovább erősítheti Becker „minden ember a maga történésze” gondolatát.
Ám épp ezek a körülmények eredményezhetik azt, hogy a humán történészi munka valójában nem válik feleslegessé, hanem épp ellenkezőleg, most lehet rá különösen nagy szükség. Ugyanis az eddig elmondottakból egyenesen következhet az, hogy felértékelődik az emberi forráskritika mint történettudományi módszer, vagyis a megalapozott „élő” tudományos gondolkodás és tapasztalat. Ez még talán akkor is igaz, ha tudjuk, hogy a történészek sem lehetnek teljesen objektívek. Az ebből adódó kérdés az, hogy a „történész-céhen” kívüli szélesebb társadalom felismeri-e a mesterséges intelligencia által létrehozott „tudás” fokozottan illuzórikus és torzított voltát, és ez a felismerés erősíti-e a történészekben, illetve a történettudományba vetett bizalmat, ami sok helyen (így Magyarországon is) egyébként rendkívül ingatag. Ebben persze nekünk, történészeknek is fokozott felelősségünk van. Figyelemmel kell kísérnünk a mesterséges intelligencia algoritmusokkal kapcsolatos új fejleményeket és segítenünk kell az ezek által generált tartalmak kritikus kezelését (ami, lássuk be, a „fake news” korában önmagában is szinte szélmalomharcnak tűnik), mert az ilyen eszközök használata megállíthatatlanul terjedni fog, és ezáltal befolyásolhatják azt, ahogyan az emberek a múlthoz közelítenek és ahogyan értelmezik azt.
IRODALOM
- Becker, Carl (1932): Everyman His Own Historian. The American Historical Review, 37. No. 2. 221–236.
- Bunout, Estelle – Ehrmann, Maud – Clavert, Frédéric (2023, eds.): Digit used Newspapers – A New Eldorado for Historians? Reflections on Tools, Methods and Epistemology. De Gruyter, Berlin–Boston.
- Clavert, Frédéric (2021): History in the Era of Massive Data. Online Social Media as Primary Sources for Historians. Geschichte und Gesellschaft, 47. Jahrg. H. 1. 175–194.
- Dwork, Cynthia – Minow, Martha (2022): Distrust of Artificial Intelligence. Daedalus, 151. No. 2. 309–321.
- Guldi, Jo (2023): The Dangerous Art of Text Mining. A Methodology for Digital History. Cambridge University Press, Cambridge – New York.
- Gyáni Gábor (2020): A történeti tudás. Osiris Kiadó, Budapest.
- Halder, Santoshi – Saha, Sanju (2023): The Routledge Handbook of Education Technology. Routledge, London – New York.
- Hegedűs István (2019): Hogyan segít újragondolni a levéltárak szerepét a mesterséges intelligencia és a gépi tanulás? Levéltári Közlemények, 90. évf. 89–98.
- Herck, Sytze van (2022): Historians as Computer Users. Organizing Sources with Digital Asset Management for a History of Computing. In: Fickers, Andreas – Tatarinov, Juliane (eds.): Digital History and Hermeneutics. Between Theory and Practice. De Gruyter, Berlin–Boston, 219–235.
- Hitchcock, Tim – Shoemaker, Robert (2015): Making History Online. Transactions of the Royal Historical Society, Vol. 25. 75–93.
- Hitchcock, Tim (2013): Confronting the Digital. Or how academic history writing lost the plot. Cultural and Social History, Vol. 10. No. 1.9–23.
- Hughes-Warrington, Marnie (2022): Toward the Recognition of Artificial History Makers. History and Theory, Vol. 61. No. 4. 107–118.
- Kansteiner, Wulf (2022): Digital Doping for Historians: Can History, Memory, and Historical Theory Be Rendered Artificially Intelligent? History and Theory, Vol. 61. No. 4. 119–133.
- Kerepeszki Róbert – Schrek Katalin (2023, szerk.): Bevezetés a történettudományba és a történelemkutatás módszereibe. Kronosz Kiadó, Pécs.
- Lässig, Simone (2021): Digital History. Challenges and Opportunities for the Profession. Geschichte und Gesellschaft, 47. Jahrg. H. 1. 5–34.
- Lengyel Ádám (2023): Az AI és a (történet)tudomány jövője(?). Újkor.hu,
Online: https://ujkor.hu/content/az-ai-es-a-tortenettudomany-jovoje (Letöltés: 2023. dec. 16.) - Maróthy Szilvia (2020): Digitális bölcsészet. A szövegtől az adatig. Akadémiai Kiadó, Budapest.
https://mersz.hu/marothy-a-szovegtol-az-adatig// (Letöltés: 2023. dec. 17.) - Meadows, R. Darrell – Sternfeld, Joshua (2023): Artificial Intelligence and the Practice of History. A Forum. The American Historical Review, Vol. 128. No. 3. 1345–1349.
- Nicholson, Bob (2013): The Digital Turn. Exploring the methodological possibilities of digital newspaper archives. Media History, Vol. 19. No. 1. 59–73.
- Nicholson, Bob (2016): Digital Research. In: Gunn, Simon – Faire, Lucy (eds.): Research Methods for History. Edinburgh University Press, Edinburgh, 170–190.
- Norton, John (2023): Can ChatGPT Help with Historical Research? MiddleWeb Online,
https://www.middleweb.com/48710/gpt-4-help-with-history-ill-take-a-pass-thanks/ (Letöltés: 2024. jan. 9.) - Pariser, Eli (2011): The Filter Bubble. What the Internet is Hiding from You. The Penguin Press, New York.
- Putnam, Lara (2016): The Transnational and the Text-Searchable: Digitized Sources and the Shadows They Cast. The American Historical Review, Vol. 121. No. 2. 377–402.
- Rees, Tobias (2022): Non-Human Words: On GPT-3 as a Philosophical Laboratory. Daedalus, Vol. 151. No. 2. 168–182.
- Schmidt, Benjamin (2023): Representation Learning. The American Historical Review, Vol. 128. No. 3. 1350–1353.
- Sebők Vilmos – Ring Orsolya – Máté Ákos (2021): Szövegbányászat és mesterséges intelligencia R-ben. Typotex, Budapest.
- Soh, Leen-Kiat – Lorang, Elizabeth – Pack, Chulwoo – Liu, Yi (2023): Applying Image Analysis and Machine Learning to Historical Newspaper Collections. The American Historical Review, Vol. 128. No. 3. 1382–1389.
- Sternfeld, Joshua (2023): AI-as-Historian. The American Historical Review, Vol. 128. No. 3. 1372–1377.
- Tilton, Lauren (2023): Relating to Historical Sources. The American Historical Review, Vol. 128. No. 3. 1354–1359.
- Tolcsvai Nagy Gábor (2018, szerk.): A humán tudományok és a gépi intelligencia. Gondolat Kiadó, Budapest.
- Karvalics László (2018): Nagy adat és digitális történelem: Egy izgalmas házasság múltja, jelene és jövője. Magyar Tudomány, 179. évf. 5. sz. 668–682.
ABSTRACT
Kerepeszki, Róbert Historians, „Digital History” and Artificial Intelligence This paper explores the relationship between „digital history” and artificial intelligence, looking at how the technological environment of the 21st century has changed and continues to change the work of historians. The increasing use of various generative AI tools affirms the relevance of the topic. The paper draws on recent international literature to reflect on the impact of digital history and artificial intelligence on the discipline of history, highlighting different applications (e.g. text mining) and the challenges that technological developments pose for historians. Finally, it argues that by improving digital research methods, applying consistent source criticism, and developing an appropriate communication strategy, AI may become indispensable to historical research. Keywords: Digital history, artificial intelligence, historical science, digital history research, ChatGPT, challenges |
JEGYZETEK
https://www.middleweb.com/48710/gpt-4-help-with-history-ill-take-a-pass-thanks/ (Letöltés: 2024. jan. 9.) – A problémára egyébként Kansteiner is felhívja a figyelmet. Lásd Kansteiner (2022) 128.