Pregunta de entrevista de TikTok

Why LLM uses Layer Normalization not Batch Normalization