Systemaattiset kirjallisuuskatsaukset ovat yhä useammin tekoälyn tukemia. Ne nopeuttavat prosessia, mutta herättävät myös kysymyksiä luotettavuudesta ja eettisyydestä. Artikkelissa tarkastellaan tekoälyn hyötyjä, haasteita ja sovelluksia SLR-prosessissa.
Martti Asikainen & Janne Kauttonen, 15.5.2025
Tekoälyn nopea kehitys on avannut uusia mahdollisuuksia niin akateemisessa maailmassa kuin yrityselämässäkin. Erityisesti generatiiviset tekoälymallit ja suuret kielimallit (LLM) ovat osoittautuneet arvokkaiksi työkaluiksi laajojen tietomassojen, kuten tieteellisen kirjallisuuden käsittelyssä. Tässä kirjoituksessa käsittelemme systemaattista kirjallisuuskatsausta (SLR), joka on runsaasti käytetty ja riippumaton akateeminen metodi. Sen tavoitteena on tunnistaa ja arvioida kaikki aihealueeseen, ilmiöön tai tutkimuskysymykseen liittyvä oleellinen kirjallisuus, joka mahdollistaa johtopäätöksien tekemisen puolueettoman, läpinäkyvän ja toistettavissa olevan menetelmän avulla (Kitchenham & Charters 2007).
Systemaattiset kirjallisuuskatsaukset ovat kasvattaneet viime vuosina suosiotaan erityisesti liiketalouden ja johtamisen tutkimuksessa, mutta kaikista yleisimpiä ne ovat edelleen lääketieteessä ja terveysteknologiassa (Klatt 2023). Kirjallisuuskatsauksen tekeminen on perinteisesti työläs manuaalinen prosessi, joten ei siis ihme, että tekoäly on syöksynyt ryminällä apuun. Suomessa kehitetyn terveysteknologian tuotevienti on kasvanut lähes joka vuosi jo viimeisen parikymmenen vuoden ajan (Business Finland 2023), joten kaikki tätä prosessia tukevat menetelmät ovat erittäin tarpeellisia ja ajankohtaisia. Tekoälyn avulla on mahdollista automatisoida perinteisempiä, rutiininomaisia tehtäviä sekä hallita suuriakin määriä dataa, mikä vapauttaa asiantuntijoiden aikaa vaativampiin tehtäviin.
Lääketieteen ja terveysteknologian arviointi edellyttää kasvavien tietomäärien käsittelyä, systemaattista dokumentaatiota ja näyttöön perustuvaa lähestymistapaa. Erityisesti kliiniset laite- ja lääketutkimukset sekä lääkinnällisten laitteiden sääntelyvaatimukset asettavat merkittäviä resurssihaasteita alan pienemmille toimijoille. Systemaattiset kirjallisuuskatsaukset ovat olennainen osa tätä prosessia, mutta niiden suorittaminen manuaalisesti on aikaa vievää ja samaan aikaan myös altis inhimillisille virheille. Tekoäly ei kärsi väsymisestä, suoritustason vaihtelusta, harhailevasta mielestä tai muutossokeudesta, joten se on parhaimmillaan juuri rutiininomaisten ja tylsien tehtävien parissa.
Tutkimusten lähtötiedoiksi vaadittavat kirjallisuuskatsauksen tutkimustietokantojen hakulöydöksiä on tyypillisesti satoja tai jopa tuhansia yhdessä projektissa (Asikainen 2024). Viime vuosina tehdyt tutkimukset sekä yritystapaukset antavat kuitenkin viitteitä, että tekoäly voi nopeuttaa etenkin seulonta- ja tiedonpoimintavaiheita tehostaen näin tutkimusten tunnistamista ja analysointia (esim Bolaños ym. 2024). Samalla se mahdollistaa entistä laajemman katsauksen tekemisen, kun kieli tai tehtyjen hakujen määrä ei ole este. Ihmisen työ helpottuu huomattavasti, jos tekoäly voi hoitaa kaikki helpoimmat tiedonhakutehtävät, ja ihminen voi keskittyä vain hankalimpiin tapauksiin.
Tekoälysovellukset voivat myös auttaa tutkijoita tunnistamaan keskeisiä teemoja ja niihin liittyviä aukkoja tutkimuskentän laajoista tietomassoista (Wagner ym. 2022). Terveysteknologialla onkin hyvät edellytykset toimia tekoälyn käyttöönoton edelläkävijänä. Jo tänä päivänä tekoäly, eli käytännössä suuret kielimallit, on saavuttanut riittävän tason vaativiinkin tiedonhaku- ja seulontatehtäviin. Tutkimustrendien ja teknologisen kehityksen perusteella on mahdollista ennakoida jopa ilman kristallipalloa, että kehitys jatkuu ja tekoäly muuttaa systemaattisten kirjallisuuskatsausten laatimisprosessin sekä tiedonkeruun koko kentän jo lähivuosina. Tämän puolestaan voi odottaa tehostavan analyysiprosessia ja tulosten tarkkuutta, mikä puolestaan vahvistaa näyttöön perustuvaa päätöksentekoa ja vauhdittaa innovaatioiden kehittymistä toimialalla.
Mikäli valmiit työkalut ovat liian rajoittuneita tai kalliita, myös oman sovelluksen tekeminen on varteenotettava mahdollisuus. Kaikki tehokkaimmat tekoälymallit on mahdollista ottaa käyttöön myös API-rajapintojen kautta (esim. OpenAI API), ja siten integroitavissa helposti osaksi omaa sovellusta. Lähes yhtä tehokkaita, avoimia tekoälymalleja on tarjolla myös ilmaiseksi, mikäli kontrolli halutaan ottaa täysin omaan hallintaan.
Hyvänä esimerkkinä tekoälyn integroimisesta toimii suomalaisen Finnish AI Regionin (FAIR) asiakasyritys, joka kehitti oman tekoälypohjaisen ratkaisun systemaattisten kirjallisuuskatsausten automatisointiin. Sovelluksen kerrotaan tehostavan huomattavasti yrityksen MDR:n (eng. Medical device regulation) ja IVDR:n (eng. In-vitro Diagnostic Device Regulation) kliinisiin arviointeihin vaadittavien kirjallisuuslöydösten hankintaa. Sovellus validoitiin yli tuhannen lääketieteellisen artikkelin aineistoilla, jotka yrityksen kliiniset asiantuntijat arvioivat ja luokittelivat.
Sovelluksensa ansiosta yritys kykeni tehostamaan löydöstensä käsittelyä sekä parantamaan arviointien tarkkuutta ja luotettavuutta. Tarkkuuden osalta sovellus pääsi tuotekohtaisten hakujen osalta jopa 100 %:n osumatarkkuuteen ja koko tutkitun, yli tuhannen artikkelin aineiston osalta 93 %:n tarkkuuteen. Samalla myös tuottavuus nousee, kun yritys kykenee käsittelemään suurempia projektimääriä sekä tekemään entistäkin laajempia kirjallisuuskatsauksia ilman merkittäviä lisäkustannuksia tai henkilöstölisäyksiä.
Tekoälysovelluksia omaksuessa on aina otettava huomioon niiden käyttöön liittyvät huomattavat riskit. Pahimmillaan käyttö voi vaarantaa koko katsauksen luotettavuuden ja paikkansapitävyyden, ja siten myös siitä vastuussa olevien tutkijoiden tai tutkimuksesta vastuussa olevan tutkimuskeskuksen, yliopiston tai yrityksen maineen. Tästä syystä on tärkeää kehittää iteratiivisesti keinoja tunnistaa ja estää virheiden päätymisen lopulliseen julkaisuun. Näitä virheitä ovat eritysesti tekoälyn itse keksimät eli hallusinoimat lähteet ja/tai aitojen lähteiden virheelliset tulkinnat.
Modernit tekoäly- ja kielimallit voivat tuottaa varsin uskottavalta kuulostavaa virheellistä tietoa, jotka voivat ilman ihmisvalvontaa päätyä mukaan katsaukseen (Fabiano ym. 2024). Sen kautta virheellinen tieto puolestaan voi levitä laajemmalle akateemiseen maailmaan. Hyvä esimerkki virheellisen tiedon nopeasta leviämisestä tiedejulkaisuissa on nk. ”vegetative electron microscopy” -tapaus (Snoswell ym. 2025). Tämä merkityksetön fraasi levisi yli 20 tieteelliseen julkaisuun vuodesta 2017 alkaen. Ilmaus syntyi, kun konenäköohjelma teki digitointivirheen lukiessaan kahdelle eri palstalle jaettua 1950-luvun tieteellistä artikkelia (ks. Strange 1959). Lisäksi mukana oli farsin kielen käännösvirhe.
Tapaus osoittaa, kuinka helposti virheellinen tieto leviää tiedemaailmassa ja miten ilmeisetkin virheet voivat päästä vertaisarvioinnin seulan läpi. Viime vuosina useat tutkimukset ovat osoittaneet huolensa tieteen integriteetin katoamisesta ja tahrautumisesta, joka on näkynyt esimerkiksi tiettyjen adjektiivien ja adverbien lisääntyneenä käyttönä (esim. Liang ym. 2024; Gray 2024; Haider ym. 2024; Leonard 2025).
Monet pitävätkin tekoälyä uhkana tieteen uskottavuudelle (esim. Conroy 2023). Näistä edellä mainituista syistä on erityisen tärkeää, että analyysin tai tutkimuksen tekevät henkilöt ovat perillä tekoälyn rajoituksista ja kykenevät ammattitaidollaan varmistamaan, että sen käyttö tukee tehtävän katsauksen tai tutkimuksen laatua ja luotettavuutta (Fabiano ym. 2024). Erityisesti suuriin kielimalleihin pohjautuvien assistenttien kohdalla suurimpina haasteina nähdään malleilta puuttuva domain-asiantuntemus niche-aihepiireistä, hallusinaatiot ja ”mustan laatikon” -ongelma, jossa algoritmi, koulutusdata tai malli salataan immateriaalioikeuksien suojelemiseksi (Bolaños ym. 2024). Siksi tekoälyn täysipainoinen hyödyntäminen systemaattisissa kirjallisuuskatsauksissa edellyttääkin ihmiskeskeisiä ja luotettavia työnkulkuja, jotka todennetaan avoimen, standardoidun arviointikehyksen avulla, joka tarkastelee samanaikaisesti suorituskykyä, käytettävyyttä ja läpinäkyvyyttä.
Tutkimusetiikan kannalta on myös suotavaa raportoida tutkimuksen yhteydessä käytetyistä tekoälysovelluksista, sillä läpinäkyvyys on tieteen peruspilareista (Gray 2024). Suurin osa tiedejulkaisijoista sallii tekoälyn käytön julkaisujen hiomiseen, mutta samaan aikaan ne edellyttävät sitä, että käyttö kuvataan selkeällä ja helposti ymmärrettävällä tavalla (Gray 2024; Rantanen & Sahlgren 2024). Kuvauksessa voidaan tuoda esiin esimerkiksi käyttö tiedonhaussa, ideoinnissa, kieliasun tarkastamisessa tai kääntämisessä.
Suosituksemme yrityksille, jotka harkitsevat tekoälyn hyödyntämistä ja automatisointia systemaattisten kirjallisuuskatsausten tekemiseen (Fabiano ym. 2024 mukaillen):
TKI-viestinnän asiantuntija
+358 44 920 7374
martti.asikainen@haaga-helia.fi
Vanhempi tutkija
+358 294471397
janne.kauttonen@haaga-helia.fi
Asikainen, M. (2024). Suomalaisfirma valjasti tekoälyn lääkinnällisten laitteiden tutkimusten tueksi – kehitti FAIR:in kanssa työkalun alle neljässä kuukaudessa. Julkaistu Finnish AI Regionin verkkosivuilla 13.12.2024. Viitattu 2.5.2025.
Bolaños, F., Salatino, A., Osborne, F., & Motta, E. (2024). Artificial intelligence for literature reviews: opportunities and challenges. Artificial Intelligence Review, 57 (259). Springer Nature. Lontoo.
Business Finland. (2023). Suomessa kehitetyt ratkaisut parantavat terveyssektorin kantokykyä maailmalla. Julkaistu Business Finlandin verkkosivuilla 21.8.2023. Helsinki. Viitattu 3.5.2025.
Chaturvedi, A. (2025). AI’s Impact on Literature Review: A Comprehensive Review of the Best Tools. Julkaistu Mediumissa 23.1.2025. Viitattu 3.5.2025.
Conroy, G. (2023). Scientific sleuths spot dishonest ChatGPT use in papers. Julkaistu Naturessa 8.9.2023. Nature. Nature Portfolio. Springer Nature. Lontoo. Viitattu 4.5.2025.
Fabiano, N., Gupta, A., Bhambra, N., Luu, B., Wong, S., Maaz, M., Fiedorowicz, J. G., Smith, A. L. & Solmi, M. (2024). How to optimize the systematic review process using AI tools. JCPP Advances 2024, 4(2). Wiley-Blackwell. Hoboken.
Gray, A. (2024). ChatGPT ”contamination”: estimating the prevalence of LLMs in the scholarly literature. ArXiv Preprint. Cornellin yliopisto (arXiv).
Haider, J., Söderström, K. R., Ekström, B. & Rödl, M. (2024). GPT-fabricated scientific papers on Google Scholar: Key features, spread, and implications for preempting evidence manipulation. Misinformation Review 2024, 5(5), s.1-16. Harvard Kennedy School. Cambridge.
Kitchenham, B. & Charters, S. M. (2007). Guidelines for performing Systematic Literature Reviews in Software Engineering. Keele University ja University of Durham Joint Report.
Klatt, F. (2023). Business Systematic Literature Reviews. Die Bibliothek. Wirtschaft & Management -työpaja 30.6.2023. Technishe Universität Berlin. Viitattu 3.5.2025.
Leonard, J. (2025). AI-enabled fakery has ‘infiltrated academic publishing’ say researchers. Julkaistu Computingissa 17.2.2025. The Channel Company. Viitattu 3.5.2025.
Liang, W., Izzo, Z., Zhang, Y., Lepp, H., Cao, H., Zhao, X., Chen, L., Ye, H., Liu, S., Huang, Z., McFarland, D.A. & Zou, J.Y. (2024). Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews. ArXiv Preprint. Cornellin yliopisto (arXiv).
Rantanen, V. & Sahlgren, O. (2024). Tekoälyn hyödyntäminen tutkimuksessa vastuullisuuteen ja kestävyyteen liittyvät näkökulmat huomioiden. Esitys pidettiin Tampereen yliopiston johtamisen ja talouden tiedekunnan tekoälyaiheisessa tutkimusiltapäivässä 24.9.2024. Viitattu 3.5.2025.
Snoswell, A.J., Witzenberger, K. & El Masri, R. (2025). A weird phrase is plaguing scientific papers – and we traced it back to a glitch in AI training data. Julkaistu The Conversationissa 15.4.2025. The Conversation. Melbourne. Viitattu 14.5.2025.
Strange, R.E. (1959). Cell Wall Lysis and the Release of Peptides in Bacillus Species. ASM Journals. Bacteriological Reviews 23(1). American Society for Microbiology. Washington.
Wagner, G., Lukyanenko, R. & Pare, G. (2022). Artificial intelligence and the conduct of literature reviews. Journal of Information Technology, 37(2), s. 209-226. Sage Journals. Thousand Oaks.