Large language model

Hvad er en LLM?

En Large Language Model (LLM) er en avanceret kunstig intelligens-teknologi, der er specialiseret i at behandle, forstå og generere menneskelignende tekst 1 2.

Pasted image 20241202091757.png
Billedet er fra aidegreeguide

Centrale karakteristika

LLM'er er Deep-learning algoritmer, der anvender transformermodeller og trænes med massive datamængder. De har følgende centrale egenskaber:

Trænet på milliarder af teksteksempler fra forskellige kilder som bøger, artikler og websider
Kan udføre opgaver som tekstgenerering, oversættelse og samtale
Benytter neurale netværk inspireret af den menneskelige hjerne
Arbejder ved at tokenisere input og udføre matematiske ligninger for at opdage relationer mellem tokens 1

Hovedtyper af LLM'er

Der eksisterer tre primære typer af LLM'er:

Generiske sprogmodeller: Forudsiger det næste ord baseret på træningsdata
Instruktionsindstillede modeller: Trænet til at besvare specifikke instruktioner
Dialogindstillede modeller: Trænet til at føre sammenhængende dialoger 1

Praktiske eksempler

Kendte eksempler på LLM'er inkluderer:

Google Translate
OpenAI's GPT-serien
ChatGPT

LLM'er repræsenterer en revolutionerende teknologi, der åbner nye muligheder inden for kunstig intelligens og sprogbehandling 1 2.