LLM의 답변 컨트롤을 알아보자!
2025.05.05.

Ⅰ. LLM이 답변을 생성하는 원리
1. 입력 & Logit 값 생성
Next Token
Logit Value
2. Temperature 연산 & 확률분포 생성
2-1. 원래 Logit
Token
Logit
2-2. Temperature가 0.5인 경우
Token
Logit (temperature 정규화)
2-3. 확률분포 생성
Token
P(token)
3. Filtering
3-1. Top-K 필터링
Token
P'(token)
3-2. Top-P 필터링
Token
Probablity
P'(token)
4. Sampling
4-1. Greedy Sampling
4-2. Random Sampling
Last updated