EU pakottaa teknologiajätit avaamaan tekoälyn koulutusdataa

Euroopan komissio vaatii tekoälyjättejä paljastamaan, millä aineistolla niiden tekoälymallit on koulutettu. Uudet säännöt astuvat voimaan vuonna 2026.

software development flowchart, concept for computer programming, machine learning, visual representation of code flow (3d render)

Teksti: Martti Asikainen, 25.7.2025 Kuva: Adobe Stock Photos

Nauha, jossa FAIR:in yhteistyökumppanien logot.

Euroopan komissio ottaa tiukemman otteen tekoälyalan jättiläisiin. Keskiviikkona esitelty pakollinen läpinäkyvyysmalli pakottaa OpenAI:n, Googlen ja Metan kaltaiset yritykset kertomaan, millä aineistolla niiden vaikuttavat tekoälymallit on koulutettu.

Uudet säännöt koskevat niin sanottuja perustamalleja, kuten ChatGPT:n taustalla olevaa GPT-4:ää, Googlen Geminiä ja Metan Llamaa. Yritysten on toimitettava ”riittävän yksityiskohtaiset yhteenvedot” koulutusaineistoistaan osana EU:n tekoälylakia.

— Tarjoamalla helppokäyttöisen mallin tuemme tekoälyyritysten lakien noudattamista. Näin rakennamme luottamusta tekoälyyn ja vapautamme sen täyden potentiaalin talouden ja yhteiskunnan hyväksi, sanoo komission varapuheenjohtaja Henna Virkkunen.

Yritykset eivät voi enää piilotella aineistojaan

Vuonna 2026 voimaan tulevat säännöt pakottavat tekoäly-yhtiöt kertomaan muun muassa aineiston alkuperän, sisällönsuodatusmenetelmät ja tekijänoikeussuojatoimenpiteet.

Vaikka yrityksiä ei vaadita julkaisemaan itse aineistoa, niiden on kerrottava sen sisällöstä, rakenteesta ja lähteistä. Yhtiöiden on myös kerrottava, jos ne ovat käyttäneet synteettistä dataa tai verkosta kerättyä materiaalia.

Toimenpiteen odotetaan iskevän tekoälyalan ytimeen. Koulutusaineistot ovat tyypillisesti yritysten tarkimmin varjeltuja liikesalaisuuksia, eikä niitä jaeta kovin kevyin perustein.

Euroopan komission mukaan säännöt on suunniteltu torjumaan disinformaatiota, algoritmisia vääristymiä ja tekijänoikeusloukkauksia. Tavoitteena on myös vähentää vastuuttomien tekoälyjärjestelmien systeemisiä riskejä.

Teknologiayritykset tulevat todennäköisesti vastustamaan uusia sääntöjä. Niiden mukaan liiallinen läpinäkyvyys voi paljastaa kilpailusalaisuuksia tai turvallisuushaavoittuvuuksia. EU:n viranomaiset kuitenkin korostavat, ettei tavoitteena ole tukahduttaa innovaatioita, vaan varmistaa niiden palvelevan yleistä etua.

Amerikkalaisyritykset joutuvat mukautumaan

Eurooppalainen sääntely eroaa selvästi Yhdysvaltojen vapaammasta linjasta. Amerikassa ei ole vielä syntynyt kattavaa tekoälylainsäädäntöä, eikä sellaisen myöskään odoteta syntyvän vielä lähitulevaisuudessa.

EU kuitenkin toivoo toistavansa tietosuoja-asetuksensa (GDPR) menestyksen tekoälysääntelyn avulla. GDPR on muuttanut yksityisyyslakeja maailmanlaajuisesti jo vuodesta 2018 lähtien.

Uudet säännöt pakottavat myös amerikkalaiset teknologiajätit muuttamaan toimintaansa, jos ne haluavat säilyttää pääsyn eurooppalaisille markkinoille. 

— Niin se vain menee, että jos haluat toimia Euroopan markkinoilla, niin pelaat Euroopan säännöillä, eräs poliittinen kommentaattori kiteyttää uudistuksen.

Tekoälysäädös (AI Act) on maailman ensimmäinen kattava tekoälyä säätelevä laki. Se nojaa riskiperusteiseen lähestymistapaan: mitä suuremmat riskit tekoälyjärjestelmä aiheuttaa perusoikeuksille ja turvallisuudelle, sitä tiukemmat vaatimukset sille asetetaan.

EU pelkää tekoälyn toisintavan varhaisen internetin suurimmat virheet, jolloin digitaaliset alustat saivat kasvaa liian isoiksi, liian vastuuttomiksi, ja aivan liian nopeasti.

Valvonta kohdistuu suurimpiin toimijoihin

Tämän hetkisten tietojen mukaan sääntely koskee vain tekoälymalleja, jotka rikkovat tietyt laskennalliset rajat. Näin valvonta kohdistuu suurimpiin ja vaikutusvaltaisimpiin järjestelmiin.

Yritysten on todistettava sääntelyn noudattaminen yksityiskohtaisella dokumentaatiolla. Sääntelyviranomaiset voivat tarkastaa asiakirjat, ja osa niistä saatetaan antaa tutkijoiden ja kansalaisjärjestöjen käyttöön.

Eurooppalaisille päättäjille kyse on ennen kaikkea demokratiasta. 

Tekoälyjärjestelmät vaikuttavat yhä enemmän rekrytointiin, lainapäätöksiin ja jopa tuomioistuinten ratkaisuihin. Läpinäkyvyys ei ole enää vain tekninen kysymys, vaan osa demokraattisen hallinnon ydintä.

Huoli kasvaa myös tekoälyvallan keskittymisestä muutaman yrityksen – lähinnä amerikkalaisten ja kiinalaisten – käsiin. Siksi EU haluaa varmistaa, että eurooppalaiset arvot heijastuvat myös sellaisiin teknologioihin, jotka muokkaavat tulevaisuutta.

White logo of Finnish AI Region (FAIR EDIH). In is written FAIR - FINNISH AI REGION, EDIH
Euroopan unionin osarahoittama logo

Finnish AI Region
2022-2025.
Media contacts