Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado con cantidades masivas de texto para comprender y generar lenguaje natural. GPT-4 (OpenAI), Claude (Anthropic), Gemini (Google) y Llama (Meta) son los LLM más utilizados. Estos modelos alimentan los chatbots, los motores de búsqueda con IA y numerosas herramientas de automatización.
Cómo funciona un LLM
Un LLM aprende los patrones estadísticos del lenguaje a partir de miles de millones de documentos: páginas web, libros, artículos, conversaciones, código fuente. Este aprendizaje le permite predecir la siguiente palabra en una secuencia y, por extensión, generar textos coherentes en respuesta a instrucciones.
Pre-entrenamiento: El modelo ingiere un corpus masivo y aprende las estructuras del lenguaje.
Fine-tuning: El modelo se ajusta en tareas específicas con retroalimentación humana.
Inferencia: En producción, el modelo recibe un prompt y genera una respuesta token por token.
Los principales LLM del mercado
| Modelo | Editor | Puntos fuertes |
|---|---|---|
| GPT-4 / GPT-4o | OpenAI | Polivalencia, integración con Bing |
| Claude 3.5 | Anthropic | Razonamiento, contexto largo |
| Gemini | Multimodal, integración con Search | |
| Llama 3 | Meta | Open source, personalizable |
| Mistral | Mistral AI | Rendimiento/coste, soberanía |
LLM y visibilidad de las marcas
Los LLM se están convirtiendo en intermediarios entre los usuarios y la información. Cuando alguien pregunta "qué herramienta usar para...", el LLM formula una respuesta basada en sus conocimientos de entrenamiento y el RAG. Comprender cómo funcionan los LLM permite identificar las palancas de acción para su visibilidad.