Her følger et nyhedsbrev, der primært omhandler den netop afsluttede Lex-konference. Hvis du ikke var til stede, finder du nedenfor direkte links til de enkelte oplæg fra konferencen.
Efter at OpenAI lancerede muligheden for at træne egne GPT-modeller, er en helt ny form for piratkopiering opstået, hvor flere fagbøger er blevet anvendt som træningsdata og efterfølgende udgivet af elever.
På den anden side kan vi godt lide at læse fysiske bøger og vi har modtaget bogen "Prompt Engineering - En Grundbog" af Claus Nygaard. Vi har skrevet en anmeldelse af bogen.
Et studie publiceret i "Higher Education Research & Development" undersøger sprogmodellers indvirkning på universitetsstuderende, hvilket igangsætter en vigtig debat om, hvornår sprogmodeller bør integreres i undervisningen. Kunstig intelligens omfatter dog mere end blot sprogmodeller; i en anden videnskabelig artikel har forskere anvendt maskinlæring til at undersøge øllets kemiske forbindelser 🍻
God læsning
Konference 2024: "Sådan styrer techgiganterne og kunstig intelligens din adgang til viden på nettet"
I dag googler vi, når vi søger viden, og vi har en forestilling om, at søgemaskinerne giver adgang til al indhold på nettet. Men sådan er det langtfra. Dels er det ikke teknisk muligt for søgemaskinerne at finde alt indhold, dels prioriterer de, hvilket indhold vi skal møde.
Samtidig ved vi nu, at kunstig intelligens vil revolutionere vores søgning efter viden. I fremtiden vil samtalerobotter levere skræddersyede svar og anbefalinger baseret på vores præferencer og adfærd. På den ene side vil det skabe en mere interaktiv og personlig oplevelse, hvor vi kan få svar uden at skulle navigere gennem lange søgeprocesser. På den anden side vil vi måske ikke længere kende hverken kilderne eller afsenderne på den information, vi får leveret.
Alt i alt skaber den manglende sikkerhed om vores adgang til viden utryghed. Knap to ud af tre danskere er bekymrede for mis- og desinformation, og om algoritmerne giver os et skævt billede af aktuelle begivenheder. Men hvordan fungerer søgemaskinerne? Hvad kan du selv gøre for at finde frem til troværdig viden? Og hvor er der brug for, at samfundet sætter nogle rammer og sikrer fri og uhindret adgang til viden?
00:00 - Velkomst
Niels Elers Koch, bestyrelsesformand, Lex – Danmarks nationalleksikon
04:16 - Sociale medier, tech og demokrati: Hvad synes danskerne om indhold, der er bestemt af algoritmer?
Mads Bramsen, centerchef, Slots- og Kulturstyrelsen
16:53 - Kunstig intelligens i skolen – mulighed for gentænkning
Birgitte Vedersø, selvstændig ledelsesrådgiver i Vedersoe.co
31:10 - Understanding search engines, knowledge and power in a historical context
David Runciman, professor, Cambridge University
45:28 - Algoritmer og det åbne samfund: Kuratering, filtrering og søgning
Thore Husfeldt, professor, IT-Universitetet i København
1:03:10 - What results do users see in search engines? Inclusion, exclusion and curation
Dirk Lewandowski, professor, Hamburg University of Applied Sciences
1:17:07 - Informationstroværdighed i en AI-æra
Mikkel Flyverbom, professor, CBS
1:27:56 - Argumenter for mennesker – bias i kunstig intelligens
Christiane Vejlø, digital trendanalytiker
1:37:25 - Hvorfor er der brug for mange sprogmodeller?
Pernille Tranberg, dataetisk rådgiver
1:50:47 - Viden er ikke en algoritme
Erik Henz Kjeldsen, ansvarshavende chefredaktør, Lex – Danmarks nationalleksikon
1:56:48 - Politisk debat – intelligente løsninger!
Lisbeth Bech-Nielsen (SF), formand for Udvalget for Digitalisering og It
Alexander Ryle (LA), it-ordfører
Malte Larsen (S), it- og digitaliseringsordfører
Ordstyrer: Ole Kaag Mølgaard, sekretariatschef, Lex – Danmarks nationalleksikon
Konferencen er arrangeret af Lex, Danmarks nationalleksikon, i samarbejde med Danske Universiteter, Danske Professionshøjskoler, Danske Gymnasier, Danmarks Biblioteksforening og Danske Medier.
Se hele konferencen herunder:
Forlagsbøger bruges til at træne egne sprogmodeller
En helt ny udfordring er opstået, efter at brugere har fået mulighed for selv at uploade tekster, som sprogmodellerne kan bruge som udgangspunkt for prompts. Brugere uploader her ophavsretsbeskyttet materiale fra blandt andet danske forlag, hvilket efterfølgende bliver udgivet. Det danske forlag Praxis har derfor flere gange måttet kontakte OpenAI for at få fjernet brugergenererede GPT'er, som er trænet på deres data. Udfordringen består dog i, at det ikke er muligt at se, hvilke data brugerne har trænet en GPTs med, og derfor tager det lang tid at undersøge ved at prompte modellen.
Læs mere om de problematikker, Praxis står overfor, i både Politiken og det amerikanske magasin Wired.
Vi står i øjeblikket over for denne udfordring, fordi nogle deler PDF-udgaver af bøgerne fra fx Nota. Det bliver spændende at se, hvad fremtiden bringer, når sprogmodeller integreres i styresystemer og officepakker, da de så kan trænes på lokalt gemte tekster. Her kan træningsteksterne være piratkopieret materiale i lokale mapper eller specifikke "gymnasie" versioner af sprogmodeller, trænet på faglige tekster fra STX, HTX, HHX mv. Når det sker, bliver det umuligt at opdage, og forlagene bliver magtesløse.
Jeg ser visse ligheder med piratkopiering af spil, musik og film, da der i begge tilfælde er tale om juridiske og etiske udfordringer vedrørende beskyttelsen af intellektuel ejendom i den digitale tidsalder. Jeg frygter desværre, at det ender med, at der bygges solide barikader op omkring forlagenes materialer.
Ugens nyheder
Prompt engineering - en grundbog
Anmeldereksemplar modtaget fra Samfundslitteratur
Claus Nygaard har udgivet lærebogen "Prompt engineering - en grundbog", som fagligt tager fat i, hvordan man prompter til de tre største sprogmodeller: Gemini, ChatGPT og Copilot. I bogen opstiller Nygaard 24 metoder til at skrive rigtigt til sprogmodellerne for at kunne målrette prompts for dermed at få bedre resultater.
Bogen indeholder en kort introduktion til sprogmodellerne, men her savner jeg dybde i forklaringen. I min optik bliver det lidt en positiv hurratekst, som faktisk ikke giver nogen relevant teknologiforståelse til læseren - tværtimod krasser afsnittet kun på overfladen, og det ville være bedre, hvis det var udeladt fra bogen.
Når det er sagt, giver bogen en solid introduktion til promptingstrategier, med detaljerede forklaringer af hver af metoderne. Derefter demonstreres de med outputeksempler fra modellerne. Her kan bogen dog tabe noget af sin værdi, da sprogmodellernes hurtige udvikling betyder, at outputteksterne kan blive forældede. I morgen er det nemlig et andet svar, sprogmodellerne kommer med, og en helt ny model. Man går ret hurtigt død i at skulle læse sprogmodellernes trivielle og mekaniske output og ender med at hoppe videre til det væsentlige - hvorfor promptingstrategien producerer et givent output, og hvad man som bruger skal være opmærksom på. Og som underviser handler det om at se, om øvelserne vil kunne anvendes i undervisningen. Her gør Nygaard det ret godt, for det er nemt at inddrage øvelserne i undervisningen - og de kan altså også bruges på sprogmodeller som SkoleGPT eller DanskGPT.
Den seneste uge har bogen ligget i mit gymnasiums lærerværelse, hvor den har vakt stor interesse; mange har bladret i den og spurgt ind til indholdet. Det er en bog, lærerne på vores gymnasium kan relatere til, fordi den tilbyder konkret og håndgribeligt materiale på dansk. På denne måde er bogen relevant for dem, der ønsker at arbejde fagligt med sprogmodeller i undervisningen.
Videnskabelige artikler
Herunder udvælger vi artikler eller værktøjer, der har et lidt mere videnskabeligt perspektiv. Det er artikler, som vi selv læser for at holde os opdateret, og samtidig ved vi også godt, at det er noget, som ikke er så interessant for de fleste.
The impact of large language models on university students’ literacy development: a dialogue with Lea and Street’s academic literacies framework
Daniel W. J. Anson har publiceret en artikel, der undersøger store sprogmodellers, såsom ChatGPT, virkning på universitetsstuderendes literacy-udvikling. Han argumenterer for, at sprogmodellerne, mens de har potentiale til at forbedre visse aspekter af de studerendes akademiske skrivning og læsning, også indebærer risici for udviklingen af essentielle akademiske færdigheder.
Ansons centrale argument er, at en overdreven afhængighed af sprogmodeller fra universitetsstart kan hindre studerendes nødvendige kulturelle og kognitive udvikling, der er afgørende for at opnå succes på universitetet.
Læs artikelen her.
Maskinlæring afdækker øllets hemmeligheder
I en undersøgelse publiceret i Nature Communications har forskere anvendt maskinlæring til at analysere smagsprofiler i øl. Ved at analysere kemiske sammensætninger af over 250 øltyper har forskerne udviklet en model, som kan forudsige de kemiske forbindelser, der bidrager til specifikke smagsnoter, og hvad forbrugerne foretrækker. Denne omfattende undersøgelse giver klare indikationer af data og maskinlæringens fremtidige rolle i produktudviklingen inden for fødevareindustrien.
Læs om undersøgelsen herunder