Large language model
Hvad er en LLM?
Billedet er fra aidegreeguide
Centrale karakteristika
LLM'er er Deep-learning algoritmer, der anvender transformermodeller og trænes med massive datamængder. De har følgende centrale egenskaber:
- Trænet på milliarder af teksteksempler fra forskellige kilder som bøger, artikler og websider
- Kan udføre opgaver som tekstgenerering, oversættelse og samtale
- Benytter neurale netværk inspireret af den menneskelige hjerne
- Arbejder ved at tokenisere input og udføre matematiske ligninger for at opdage relationer mellem tokens 1
Hovedtyper af LLM'er
Der eksisterer tre primære typer af LLM'er:
- Generiske sprogmodeller: Forudsiger det næste ord baseret på træningsdata
- Instruktionsindstillede modeller: Trænet til at besvare specifikke instruktioner
- Dialogindstillede modeller: Trænet til at føre sammenhængende dialoger 1
Praktiske eksempler
Kendte eksempler på LLM'er inkluderer:
- Google Translate
- OpenAI's GPT-serien
- ChatGPT
LLM'er repræsenterer en revolutionerende teknologi, der åbner nye muligheder inden for kunstig intelligens og sprogbehandling 1 2.