Matomo

GPT-4 flytter grænserne for kunstig intelligens i undervisningen

GPT-4 flytter grænserne for kunstig intelligens i undervisningen

OpenAI har netop (tirsdag d. 14/3-2023 kl 18.00 dansk tid) udgivet version 4 af ChatGPT, og igen flytter det grænserne for hvad der er muligt for sprogmodeller.

Viden.ai har fået adgang til ChatGPT-4 og har selv testet en masse, men da vi kun har 100 forespørgsler pr. 4. timer indtil videre, vil en del af artiklen bygge på andres erfaringer og tests.

I artiklen kan du blive klog på de nye ændringer i GPT-4, og hvad det betyder for undervisningen. I nær fremtid vil vi dykke mere ned i den nye version og hvilke muligheder og udfordringer det giver.

Forbedringer på mange parametre

Den nye version af GPT er testet på simulering af eksaminer som er designet til mennesker, og her er det interessant at den scorer ret højt i forhold til GPT-3.5. Når vi ser på tallene, er der forbedringer inden for matetematiske udfordringer (SAT Math), jura (LSAT), evidensbaseret læsning og skrivning (SAT Evidence-Based Reading & Writing), medicin (MKSAP), kemi (AP Chemistry) og mange flere. Hele oversigten kan ses på OpenAi side om GPT-4.

Gpt-4 kan desuden håndtere meget længere tekster end GPT-3´s 2048 tokens (ca. 1500 ord). OpenAI har offentliggjort at GPT-4 kan arbejde med helt op til 32.000 tokens (25.000 ord)! Det gør den i stand til at finde indhold i, skrive resuméer af og analysere meget lange tekster, ligesom den kan skrive meget længere tekster selv. OpenAI har også testet den nye udgave på en lang række sprog, og den skulle være blevet markant bedre til mindre sprog. De hævder selv at den overgår den engelske udgave af GPT-3.5 i ydeevne.

Datasættet som ligger til grund for GPT-4 er stadig det samme som ChatGPT -  fra september 2021.

Nogle af de mest udskældte ting ved ChatGPT er, dens hallucinationer hvor den finder på facts selv, dens ukritiske formidling af skadeligt indhold (opskrifter på bomber, våben osv.), generelle misinformationer, problemer med privatlivs-informationer i træningsdata, cybersikkerhed, kraftig bias og en del flere uhensigtsmæssigheder. GPT-4 skulle være kraftigt forbedret på alle disse områder, og vil respondere med følgende, hvor man f.eks. beder om noget ulovligt:

“Som en AI udviklet af OpenAI, kan jeg ikke give vejledning, hjælp eller støtte til ulovlige aktiviteter, herunder hacking, tyveri eller andre kriminelle handlinger. Mit formål er at hjælpe og informere brugere inden for lovens rammer og etiske retningslinjer.”

Genkendelse af indhold på billeder

En kommende funktion til ChatGPT er, at kunne generere tekst ud fra billeder - dvs. sprogmodellen bliver i stand til at "se" hvad der er på et billede, og derefter analysere billedets indhold. Dette kan vise sig at blive en udfordring i undervisningen, eftersom en del opgaver netop er billedanalyse.

Herunder har vi indsat et eksempel fra OpenAI hjemmeside:

Bruger:
Answer question I.1.a. Think step-by-step.
Svar fra GPT-4:
To answer question I.1.a, we need to express the temperature T(x) in every point of the conductive bar, which is characterized by the abscissa x. We are given that T(0) = T0 and T(L) = Tb.

For a stationary regime, the heat equation for the one-dimensional heat conduction in the bar is:
d²T/dx² = 0

Integrating once, we get:
dT/dx = C₁

Integrating a second time:
T(x) = C₁x + C₂

To determine the constants C₁ and C₂, we use the boundary conditions:
T(0) = T0, which gives C₂ = T0
T(L) = Tb, which gives C₁ = (Tb - T0) / L

Finally, the expression for T(x) is:
T(x) = (Tb - T0) * (x / L) + T0
This represents a linear temperature profile along the conductive bar, with a slope of (Tb - T0) / L.

Dermed bliver det også muligt at få den til at forklare indhold fra vores fysiske tekstbøger, og samtidig komme med løsninger på opgaver alene ud fra billeder.

Et andet eksempel fra OpenAI viser, hvordan GPT-4  kan aflæse og fortolke på søjlediagrammer:

Bruger:
What is the sum of average daily meat consumption for Georgia and Western Asia? Provide a step-by-step reasoning before providing your answer.
Svar fra GPT-4:
To find the sum of average daily meat consumption for Georgia and Western Asia, we will follow these steps:

1. Identify the average daily meat consumption for Georgia.
2. Identify the average daily meat consumption for Western Asia.
3. Add the values from steps 1 and 2.

Step 1: From the provided chart, we see that the average daily meat consumption for Georgia is 79.84 grams per person per day.
Step 2: From the chart, we see that the average daily meat consumption for Western Asia is 69.62 grams per person per day.
Step 3: Add the values from steps 1 and 2.
79.84 g (Georgia) + 69.62 g (Western Asia) = 149.46 g

So, the sum of average daily meat consumption for Georgia and Western Asia is 149.46 grams per person per day.

Derudover kan GPT-4 også afkode selve indholdet på billeder, og forstå konteksten.

Bruger:
What is unusual about this image?
Svar fra GPT-4:
The unusual thing about this image is that a man is ironing clothes on an ironing board attached to the roof of a moving taxi.

Funktionen, hvor GPT -4 genkender og analyserer billeder, er ikke offentligt tilgængelig endnu, men kommer i en senere version. Det kommer dog helt sikkert til at ændre den måde vi stiller opgaver i undervisningen, for ethvert billede kan nu blive omsat til tekst.

I deres live-event viste de også, hvordan et foto af en håndtegnet skitse kan blive til et simpelt website, og herfter omsat direkte til kode - meget imponerende.

Kilder

GPT-4
We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professi…

https://cdn.openai.com/papers/gpt-4-system-card.pdf

https://cdn.openai.com/papers/gpt-4.pdf