Euroopan parlamentin taistelua tekijänoikeuksista ja tekoälyn koulutusaineistoista kuvataan yleensä teknologiajättien ja luovien työntekijöiden välisenä kamppailuna. Syvin haava saatetaan kuitenkin iskeä vähemmistökieliin ja perinteisiin, joita kumpikaan osapuoli ei ole huomioinut kannoissaan
Martti Asikainen 27.3.2026 | Kuva: Adobe Stock Photos
Tunnustan, että olen viettänyt lukemattomia tunteja yrittäessäni saada tekoälytyökaluja toimimaan meänkielellä, joka on yksi Ruotsin viidestä virallisesti tunnustetusta kansallisesta vähemmistökielistä. Kieltä puhutaan Suomen ja Ruotsin välisellä raja-alueella eli Tornionlaaksossa. Ruotsin lainsäädäntö velvoittaa viranomaiset suojelemaan ja edistämään kielen säilymistä (SFS 2009:724; Council of Europe 2024; Pirinen 2025).
Kun pyydän johtavia kielimalleja kirjoittamaan kappaleen meänkielellä, niin tulokset vaihtelevat täydellisestä epäonnistumisesta digitaaliseen välinpitämättömyyteen. Edes oman kustomoidun tekoälyagentin tekeminen ei tuo lohtua ahdinkoon, vaikka jokainen eteläsuomalainenkin tietää, ettei siitä hoota sovi joka paikkaan laittaa. Tilanne on toinen englanniksi. Pyytäessä malli tuntee Shakespearenkin kuin omat taskunsa.
Tämä kuilu ei ole tekninen sattuma, vaan ennakoitava seuraus järjestelmästä, jota on koulutettu hallitsevien kielten aineistoilla, joissa meänkieli ja muut EU:n vähemmistökielet esiintyvät tuskin alaviitteissäkään. Tähän ongelmaan ei löydy ratkaisua myöskään Euroopan parlamentin maaliskuussa 2026 hyväksymästä päätöslauselmasta, joka koskee tekijänoikeuksia ja generatiivista tekoälyä. Päin vastoin se tulee lisäämään eriarvoisuutta.
Euroopan unionista puhuttaessa on harvinaista, ettei kukaan ole edes ajatellut kysyä, mitä tekijänoikeuksien valvonta tarkoittaa vähemmistökielille ja vähemmistökulttuurien edustajien tekemille teoksille. Digitaalinen toimintakyky on edellytys, että ihmiset kokevat kielen elävänä, merkityksellisenä ja yleishyödyllisenä. Toisessa vaakakupassa puolestaan ovat tekijöiden oikeudet omiin töihinsä sekä suurten teknologiajättien tarpeet.
Parlamentin äänestyksen jälkeen uutisotsikoissa korostuivat tutut vastakkainasettelut, kuten taiteilijat vastaan algoritmit, Hollywood vastaan Piilaakso, Brysseli vastaan suuret amerikkalaiset teknologiayritykset. Esittelijä Axel Voss vaati selkeämpiä sääntöjä, oikeusvarmuutta ja korvauksia oikeudenhaltijoille. Lisäksi parlamentissa toivottiin avoimuutta sekä luotettavien elimien perustamista dokumentoinnin ja vaatimustenmukaisuuden tueksi.
Nämä ovat toki oikeutettuja huolia. Ne ovat myös huolia, joita esittävät osapuolet, joilla on lakimiehiä, tekijänoikeusjärjestöjä ja markkina-asemaa. Friisiläistä runoutta ei mainittu puheissa kertaakaan. Se saattaa kuulostaa vitsiltä, mutta sillä on tosiasiassa enemmän merkitystä kuin ensi silmäykseltä voisi kuvitella. Siinä missä oikeudellinen rakenne on hyvin todellinen, se toimii epäoikeudenmukaisesti pieniä tekijöitä kohtaan.
Vuoden 2019 digitaalisen sisämarkkinan tekijänoikeusdirektiivi avasi Pandoran lippaan. Sen 4 artiklan nojalla tekoäly saa louhia tekstiä ja dataa myös kaupallisiin tarkoituksiin, ellei oikeudenhaltija ole nimenomaisesti kieltänyt sitä (EU 2019/790). Kieltäytyäkseen tekijän on ilmaistava tahtonsa konekielisesti eli metatiedoin, verkkosivuston käyttöehdoin tai vastaavilla teknisillä keinoilla. Myöhemmin tekoälysäädös lisäsi tähän velvoitteen julkaista riittävän yksityiskohtaiset yhteenvedot koulutusaineistojen sisällöstä (EU 2024/1689).
Muodollisesti kyseessä on eräänlainen opt out -järjestelmä, joka siirtää vastuun yksittäisille tekijöille ja pienille toimijoille. Heidän on tunnettava säännöt, ymmärrettävä tekniset protokollat, ilmaistava oikeutensa, ja sitten jollakin ihmeellisellä tavalla vielä varmistettava, ovatko teknologiayritykset tosiasiassa noudattaneet laki (EU 2025; EUIPO 2025; Ziaja 2024). Lienee sanomattakin selvää, ettei friisinkielisellä runoilijalla ole pienintäkään mahdollisuutta valvoa tekijänoikeuksiaan ja estää tekoälyä hyödyntämästä hänen hengentuotteittaan.
Parlamentin omassa päätöslauselmassa todetaan, että oikeudenhaltijat eivät tällä hetkellä pysty helposti tai tehokkaasti käyttämään opt out -oikeuttaan, ja että nykyinen tilanne luo systeemisen epätasapainon (EP 2026a). Paremmat rekisterit ja välittäjäelimet saattaisivat auttaa marginaalisesti. Haaste on kuitenkin siinä, että ehdotettu menettelytapa kuvittelee tekijänoikeuksien hallinnan tasapuoliseksi toimintakentäksi: luo jotain, pidätä oikeutesi, neuvoittele lisenssisi ja saat sen jälkeen korvauksen teoksesi hyödyntämisestä.
Tämä malli saattaa toimia suurille kustantajille, merkittäville musiikkiyhtiöille, tekijänoikeusjärjestöille ja studioille, joilla on omat lakiosastot. Se toimii huomattavasti heikommin pienelle kašuubialaiselle kansanmusiikkiarkistolle, ladinokieliselle kirjallisuuslehdelle tai elokuvantekijälle, joka on tuottanut yhden harvoista koskaan korniksi tehdyistä elokuvista (EP 2026a, 2026b; EU 2025). Suosimalla niitä, joilla on tekninen kapasiteetti ja oikeudelliset resurssit, opt out -järjestelmä suojelee valikoivasti hallitsevien kielten kulttuurituotantoa.
Eurooppa on paljon muutakin kuin kaupalliset toimijat. Se on võroksi kirjoittava pakinoitsija, aragonialainen kirjailija, suullista perinnettä tallentava sorbilainen ja aromanialaisten laulujen tekijä. Euroopan unionissa on 24 virallista kieltä, mutta myös noin 60 alueellista vähemmistökieltä, joista monet ovat uhanalaisia tai vaarantuneita (Pasikowska-Schnass 2020, 2016; Council of Europe 1992/1998). Näiden tekijöiden kannalta ehdotettu järjestelmä ei ole ainoastaan epäkäytännöllinen, vaan se on olematon.
Tekoälymallit oppivat datasta. Data, jolla niitä koulutetaan, muovaa myös niiden käsitystä siitä, mikä on normaalia, tärkeää ja ilmaisemisen arvoista. Internetissä käytetty kieli, jolla suuria kielimalleja koulutetaan, on voimakkaasti keskittynyttä. Joidenkin arvioiden mukaan englanti yksin kattaa noin puolet kaikista verkkosivustoista, joiden sisältökieli on tunnistettavissa (W3Techs 2026).
Tästä on helppo tehdä johtopäätös, sillä myös tutkimukset ovat yksiselitteisiä.
Pieniä ja marginalisoituja kieliä käytetään vähemmän, jonka vuoksi tarjolla olevaa aineistoa on vähemmän, se on huonompi laatuista, eikä sitä päädy samalla tavalla kielimallien koulutusdataan kuin runsasresurssisten kielten dataa (Grützner-Zahn & Rehm 2024; OECD 2023; Zhong et al. 2024; Alam et al. 2024; Micallef et al. 2025; Nuha et al. 2026). Tämä puolestaan vaikuttaa suoraan siihen, miten pienet kielet näkyvät digitaalisessa todellisuudessamme.
Seuraukset eivät rajoitu vain asiantuntijoihin ja harrastelijoihin, vaan ne koskevat meistä jokaista. Kun lapset, opettajat ja tavalliset käyttäjät turvautuvat yhä enemmän tekoälyavustajiin tutkiakseen kirjallisuutta, historiaa ja kulttuurista identiteettiä, he törmäävät ennen kaikkea valtakulttuuriin ja enemmistön perintöön. Sellaiseen, joka on hyvin edustettuna koulutusaineistoissa. Muut kielet uhkaavat jäädä enemmistön varjoon, jolloin niistä tulee vaikeammin haettavia ja tuotettavia, mikä voi helposti johtaa niiden sivuuttamiseen.
Riski korostuu entisestään, kun tekoälymallit syrjäyttävät perinteisiä hakukoneita, sillä kielet eivät katoa pelkästään silloin, kun ihmiset lakkaavat puhumasta niitä. Ne katoavat myös silloin, kun ne lakkaavat olemasta hyödyllisiä niissä välineissä ja instituutioissa, joiden ympärillä arkielämämme ja rutiinimme pyörivät. Jos nämä järjestelmät eivät tue kieltä, niin käyttäjät voivat kokea kielen tarpeettomaksi, puutteelliseksi ja riittämättömäksi.
Tämä ei tapahdu kuitenkaan yhdessä rytäkässä. Kokemukset kertyvät vuorovaikutus vuorovaikutukselta. Kun sorbilainen kirjailija havaitsee, ettei kielimallista ole mitään hyötyä hänen työssään, tai kun saamelainen muusikko tajuaa, ettei hänen nauhoittamistaan äänitteistä ole mitään mainintaa kielimallin koulutusaineistossa. Se tapahtuu, kun aromanialainen sanoittaja huomaa, etteivät käännöstyökalut osaa kääntää hänen sanoituksiaan.
Nämä eivät ole yksittäistapauksia, jotka siivotaan myöhemmin kuntoon, vaan osa eurooppalaista historiaa ja elävää kulttuuriperintöä, jolle ei ole sijaa markkinavetoisessa maailmassa. Euroopan parlamentin päätöslauselmassa tekijänoikeuksista, luovuudesta ja kulttuurisesta monimuotoisuudesta puhutaan kokonaisuutena (EP 2026a). Euroopan neuvoston kielikehys on olemassa juuri siksi, että alueelliset ja vähemmistökielet tarvitsevat aktiivista tukea pysyäkseen elävänä osana eurooppalaista kulttuurista identiteettiä (Council of Europe 1992/1998).
Kaikesta tästä huolimatta markkinakeskeinen järjestelmä tekoälylisensoinneille ja opt out -mekanismeille suosii luonteensa vuoksi niitä, joilla on jo markkinavoimaa. Käytännössä tämä tarkoittaa sitä, että se suosii hallitsevia kieliä, suuria oikeudenhaltijoita ja resurssirikkaita tekijänoikeusjärjestöjä. Tästä syystä pidän selvänä, etteivät markkinat tule ratkaisemaan vähemmistökieliin liittyvää ongelmaa. Kulttuuripolitiikan saralla on tunnistettu jo vuosikymmeniä sitten, etteivät markkinat yksin pysty säilyttämään kulttuurista monimuotoisuutta.
EU:n tulisi käsitellä digitaalista käytettävyyttä kielen selviytymisen kysymyksenä, ei pelkkänä kieli- ja oikeuspolitiikkana. Kuolleen kielen herättäminen henkiin on paljon haastavampaa kuin kuolevan kielen elvyttäminen. Myös tutkijat ovat päätyneet samaan johtopäätökseen. Mikäli kieli puuttuu digitaalisesta elämästä, niin sen säilyttäminen elävänä välineenä vaikeutuu merkittävästi (Pasikowska-Schnass 2020). Tekoälyavustajien yleistyessä kyseinen logiikka korostuu entisestään.
Mikäli EU:n lainsäädäntö ja toimintamallit huomioivat heikosti tunnustettuja vähemmistökieliämme, niin kyseessä ei ole neutraali tekninen lopputulos, vaan poliittinen epäonnistuminen. Sellainen, joka voidaan sekä nimetä että korjata ennen kuin on liian myöhäistä (Grützner-Zahn & Rehm 2024; Pirinen 2025). Tämä ei edellytä parlamentin rakentaman tekijänoikeuskehyksen purkamista, vaan sen varmistamista, että kehys on suunniteltu koko eurooppalaisen tekijäkirjon ehdoilla — ei ainoastaan niiden, joilla on varaa istua kabineteissa ja neuvotella.
Ratkaisut eivät ole käsitteellisesti monimutkaisia, vaikka ne ovatkin poliittisesti kiusallisia. Rekisterimekanismeissa tulisi olla aktiivinen kulttuurinsuojelullinen tehtävä pelkän passiivisen vaatimustenmukaisuustehtävän sijaan. Ehdotettu rekisteri, joka on suunniteltu auttamaan suuria oikeudenhaltijoita dokumentoimaan opt out -valintojansa palvelee pelkästään suuria oikeudenhaltijoita.
Jos tekijänoikeuksien ympärille rakennettavat mekanismit ja infrastruktuuri suunnIteltaisiin jo alun alkaen sellaiseksi, että se pitäisi sisällään luettelointituen vähemmistökielien arkistoille, teknisen tuen ja monikielisen opastuksen, niin se voisi palvella koko Euroopan kulttuurillista ekosysteemiä. Käytännössä tämä tarkoittaisi stiä, että ladinokielinen kirjallisuuslehti tai meänkielinen äänitearkisto voisi rekisteröidä materiaalinsa ja ilmaista opt out -oikeutensa ilman lakimiestä tai tietotekniikan asiantuntijaa. Nyt tämä ei ole realistista kummallekaan.
Lisäksi olisi syytä harkita, tulisiko osa tekoälyn tekijänoikeussovittelusta syntyvistä lisensointituloista sijoittaa suoraan takaisin kulttuurin monimuotoisuuteen. Ajatus ei ole eksoottinen. Kohdennettu rahasto digitoinnille, aineistojen rakentamiselle, opetusmateriaalille ja luovalle tuotannolle alueellisilla ja vähemmistökielillä olisi sopusoinnussa EU:n jo tekemien sitoumusten kanssa, joista meistä jokainen maksaa tälläkin hetkellä. Rahat tulisivat teknologiayrityksiltä, jotka koukuttavat mallejaan eurooppalaisen kulttuuriperinnön pohjalta.
Tekoälyä koskevassa tekijänoikeuskeskustelussa on pohjimmiltaan kysymys siitä, kuka pääsee hyötymään tekoälymurroksesta ja kuka jää jälkeen. Äänekkäimmät osallistujat ovat hyvin resursoituja, tiiviisti järjestäytyneitä ja uppoutuneita suurten kielten arkkitehtuuriin. He todennäköisesti saavuttavat jonkinlaisen sovitteluratkaisun. Pienempien toimijoiden ja vähemmistöjen osalta tilanne on hyvin toisenlainen.
Viime kädessä kysymys on kuitenkin siitä, muistaako EU sovitteluratkaisua solmiessaan myös sen, mitä se on toistuvasti korostanut omissa sitoumuksissaan. Eurooppa on monimuotoinen, ja sen vähemmistökielet eivät ole jäännöksiä vaan elävää kulttuuria ja välineitä, jotka kannattelevat arkea ja rakentavat ympärillämme olevaa maailmaa. Tämä keskustelu on parempi käydä tekijänoikeuskeskustelun sisällä, ei sen rinnalla tai sen jälkeen. Ennen kuin päätökset sinetöidään, rekisterit viimeistellään, ja lisensointirakenteet luodaan.
Kuten jo aiemmin totesin, kun kieli katoaa digitaalisen todellisuudestamme, niin mikään lainsäädäntö ei pysty tuomaan sitä takaisin. Jos meänkieli ei toimi moderneissa välineissä, niin se alkaa näyttää tarpeettomalta nuorten silmissä. Ja se näyttää siltä erityisesti niille, jotka vasta opettelevat, mistä he tulevat, mitä he edustavat ja missä lepäävät heidän juurensa, kun puhutaan monimuotoisesta ja yhtenäisestä Euroopasta.
Alam, F., Hettiarachchi, H., Braud, C., Rani, P., Uyangodage, L., Abdul-Mageed, M., & Nakov, P. (2024). LLMs for low resource languages in multilingual settings: Tutorial. Association for Computational Linguistics. https://aclanthology.org/2024.eacl-tutorials.5/
Euroopan neuvosto. (1992/1998). European Charter for Regional or Minority Languages. https://rm.coe.int/16800cb5e5
Euroopan neuvosto. (2024). Eighth evaluation report on Sweden. https://rm.coe.int/sweden-eval-iria-8-en/1680aee227
Euroopan parlamentti. (2026a, 10. maaliskuuta). Copyright and generative artificial intelligence — opportunities and challenges (Resolution P10_TA(2026)0066). https://www.europarl.europa.eu/doceo/document/TA-10-2026-0066_EN.html
Euroopan parlamentti. (2026b, 10. maaliskuuta). Protecting copyrighted work and the EU’s creative sector in the age of AI (Tiedote). https://www.europarl.europa.eu/news/en/press-room/20260306IPR37511
Euroopan unioni. (2019). Directive (EU) 2019/790 on copyright and related rights in the Digital Single Market. https://eur-lex.europa.eu/eli/dir/2019/790/oj
Euroopan unioni ((2024). Regulation (EU) 2024/1689 laying down harmonised rules on artificial intelligence. https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689
Euroopan unioni (2025). Generative AI and copyright: Training, creation, regulation. Euroopan parlamentti. https://www.europarl.europa.eu/RegData/etudes/STUD/2025/774095/IUST_STU(2025)774095_EN.pdf
European Union Intellectual Property Office (EUIPO). (2025). The development of generative artificial intelligence from a copyright perspective. https://www.euipo.europa.eu/en/publications/genai-from-a-copyright-perspective-2025
Grützner-Zahn, A., & Rehm, G. (2024). Surveying the technology support of languages. Association for Computational Linguistics. https://aclanthology.org/2024.tdle-1.1.pdf
Micallef, K., Gatt, A., & van der Plas, L. (2025). Benchmarking large language models against smaller language-specific models on Maltese. https://aclanthology.org/2025.findings-acl.1053.pdf
Nuha, U., Fersini, E., & Passarotti, M. (2026). Towards the first NLP benchmark for Ladin. https://aclanthology.org/2026.findings-eacl.55/
OECD. (2023). AI language models: Technological, socio-economic and policy considerations. OECD Publishing. https://www.oecd.org/content/dam/oecd/en/publications/reports/2023/04/ai-language-models_46d9d9b4/13d38f92-en.pdf
Pasikowska-Schnass, M. (2016). Regional and minority languages in the European Union. Euroopan parlamentin tutkimuskeskus. https://www.europarl.europa.eu/EPRS/EPRS-Briefing-589794-Regional-minority-languages-EU-FINAL.pdf
Pasikowska-Schnass, M. (2020). Digital survival of lesser-used languages. Euroopan parlamentin tutkimuskeskus. https://www.europarl.europa.eu/RegData/etudes/BRIE/2020/652086/EPRS_BRI(2020)652086_EN.pdf
Pirinen, F. A. (2025). Language technology for the minority Finnic languages. https://aclanthology.org/2025.iwclul-1.6.pdf
SFS 2009:724 (2009). Lag om nationella minoriteter och minoritetsspråk. https://www.government.se/contentassets/16ba706f40854a87b910941caf3891d1/language-act-in-english.pdf
W3Techs. (2026). Usage statistics of content languages for websites. https://w3techs.com/technologies/overview/content_language
Zhong, T., et al. (2024). Opportunities and challenges of large language models for low-resource languages in humanities research. https://arxiv.org/pdf/2412.04497
Ziaja, G. M. (2024). Text and data mining opt-out in Article 4(3) CDSMD. Journal of Intellectual Property Law & Practice, 19(5), 453–466.
Communications Lead
Finnish AI Region
+358 44 920 7374
martti.asikainen@haaga-helia.fi
Tämä kirjoitus on luotu osana Tekoäly ja yhdenvertaisuus työyhteisössä -hanketta (ReiluAI), jonka rahoittajina toimivat Haaga-Helia ammattikorkeakoulu ja Työsuojelurahasto.
Finnish AI Region
2022-2025.
Media contacts