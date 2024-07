Kõrge riskiga tehisaru süsteemide pakkujad on kohustatud looma põhjaliku tehnilise dokumentatsiooni ning ka seda järjepidevalt vastavalt vajadusele uuendama. Dokumentatsioonis on kohustuslik kajastada riske, meetmeid nende maandamiseks ning kirjeldada tehisintellekti mudeli loomise arendusprotsessi. Näiteks kui leitakse, et tehisintellekti süsteemil on kalduvus mõnes demograafilises rühmas teatud haigust sagedamini valesti diagnoosida, tuleb see probleem põhjalikult dokumenteerida. Dokumentatsioon peaks sisaldama ka selle riski käsitlemiseks ja vähendamiseks rakendatavaid parandusmeetmeid, mis tagaksid süsteemi töökindluse ja õiglasemaks muutumise.

Üldotstarbeliste tehistaipude ehk selliste mudelite puhul, mis teevad suure mõjuga otsuseid või millel on märkimisväärne turuosa, tuleb kirjeldada põhjalikult kõiki andmeid, mida on kasutatud mudeli treenimisel. Üldotstarbeliste tehistaipude hulka kuuluvad muuhulgas ka kõige tuntumad suured keelemudelid, nagu näiteks CoPilot ja ChatGPT. Konkreetse valdkonna jaoks loodud süsteemide puhul on kirjeldamiskohustus detailsem. Näiteks, kui tehistaip on peenhäälestatud spetsiaalselt tervisesektori jaoks, peab tehistaibu dokumentatsioon pakkuma selget ülevaadet, milliseid sisendandmeid täpselt kasutatud on - näiteks isikute röntgenpilte või teisi meditsiiniandmeid. Ka peab andma teavet selle kohta, kus kohast andmed pärinevad.

Laialdast kõlapinda on leidnud Ameerika Ühendriikides esitatud hagid, millega nõutakse tehisintellekti loonud ettevõtetelt võimalike autoriõiguste rikkumiste eest hüvitist. Hagejate hulgas on autoreid, kunstnikke ja ka ajakirjandusväljaandeid, kes on väljendanud rahulolematust selle osas, et mudeleid treenitakse ilma loata nende loodud loomingu peal. Selliste olukordade vältimiseks on oluline, et ettevõtted tagaksid, et nende tehisintellekti mudelid, mis on käsitatavad üldotstarbelise tehistaibuna, toimiksid kooskõlas autoriõiguse seadustega. See aga hõlmab mudelite treenimiseks kasutavate andmekogude hoolikalt läbi vaatamist, tagamaks, et need ei sisaldaks selliseid autoriõigusega kaitstud materjale, mille jaoks oleks vaja autori luba. Näiteks, kui ettevõte arendab tehisintellektil töötavat sisu loomise tööriista, siis peab ta kontrollima, et kõik treenimiseks kasutatavad andmed, nagu tekstid, pildid või muusika ei oleks vastava autori loata kogutud.