Las 5 capas de la IA (y conceptos que son interesantes entender)

Antes de empezar a experimentar con IA, me centré en aprender y anotar ciertos conceptos relacionados con IA para no perderme cuando leía tutoriales o documentación.

Las 5 capas de la IA

Hay muchas formas de explicar qué es la IA y cómo se estructura. A mí me ayudó pensar en ella como una pirámide de 5 capas, donde cada una construye sobre la anterior.

Capa 1: IA y Machine Learning (La Base)

Es el fundamento. Algoritmos que aprenden de datos para tomar decisiones o hacer predicciones.

Ejemplo práctico: Un sistema que analiza ventas históricas y predice qué productos se venderán más el próximo mes o los sistemas anti SPAM de los correos electrónicos. Se entrenan modelos con miles o millones de ejemplos para detectar patrones y poder determinar o predecir si algo es SPAM.

No genera texto ni imágenes. Solo analiza datos y encuentra patrones.

Capa 2: Redes Neuronales (El Detector)

Arquitecturas inspiradas en el cerebro humano. Capaces de detectar patrones complejos que los algoritmos tradicionales no pueden.

Ejemplo práctico: OCR que lee el texto de una factura escaneada, un sistema que reconoce caras en fotos o incluso las aplicaciones de los smartphones de detección de caras para desbloquearlo.

Detecta y clasifica, pero todavía no «crea» nada nuevo.

Capa 3: IA Generativa (La Creadora)

Aquí es donde están ChatGPT, Claude, Llama, Qwen… Modelos capaces de generar contenido nuevo: texto, imágenes, código, audio.

Ejemplo práctico: Le pasas una factura y le pides que extraiga los datos en formato JSON. O le describes una imagen y la genera. Tambien se incluyen aquellos chatbox que podemos crear para buscar datos en sistemas RAG.

Esta es la capa donde trabajo la mayor parte del tiempo.

Capa 4: Agentes de IA (El Ejecutor)

Un paso más allá. La IA no solo responde, sino que puede usar herramientas y tomar decisiones para lograr un objetivo.

Ejemplo práctico: Un agente que recibe un email, decide si es un pedido, extrae los datos, y los envía al ERP. Todo automático.

La diferencia con la Capa 3 es que aquí la IA «actúa», no solo «responde».

Capa 5: IA Agéntica (La Orquestadora)

Múltiples agentes trabajando juntos, coordinados para resolver problemas complejos.

Ejemplo práctico: Un sistema donde un agente analiza emails, otro consulta stock, otro genera respuestas al cliente, y un coordinador decide el flujo.

Esto es hacia donde va todo. Todavía estoy experimentando con ello. Tengo ejemplos hechos de las capas 3 y 4. Ahora estoy investigando la capa 5 convirtiendo un Agente de capa 4 en 5.

Terminología básica

Cuando empecé, estos términos me sonaban a chino. Aquí van explicados de forma simple:

LLM (Large Language Model)

El «cerebro» que genera texto. Es el modelo entrenado con millones de textos que puede entender y generar lenguaje. Un simil orientado a una empresa, seria el trabajador Junior que acaba de entrar a la empresa. Sabe de todo un poco, pero nada acerca de tu empresa.

Ejemplos: GPT-4, Claude, Llama, Qwen (el que uso yo).

Prompt y Contexto

La instrucción que le das al modelo. Cuanto mejor sea tu prompt, mejor será la respuesta. Es importante no ser escueto con lo que escribes. Situa tu prompt en un contexto mas amplio. La calidad del resultado es avismal.

Ejemplo: «Extrae el número de factura, fecha e importe total de este texto» es un prompt.

Token

La unidad de texto que procesa el modelo. Aproximadamente 1 token = 0.75 palabras en español.

Por qué importa: Los modelos tienen límites de tokens (contexto) y las APIs cobran por token.

Temperatura

Controla la «creatividad» del modelo.

Temperatura 0 = respuestas predecibles, siempre igual
Temperatura 1 = respuestas más variadas y creativas

Mi experiencia: Para extracción de datos uso temperatura baja (0.1-0.3). Para generar texto más natural, subo a 0.7.

RAG (Retrieval Augmented Generation)

Técnica para dar información específica al modelo antes de que responda. Primero buscas documentos relevantes, luego se los pasas al modelo junto con la pregunta. En nuestra comparativa con la empresa, el RAG almacenaria todos los manuales de operaciones de la empresa, para que el nuevo empleado sepa como funciona la empresa y cuales son las tareas que realiza cada departamento.

Ejemplo práctico: Tienes 1000 manuales de producto. El usuario pregunta algo. El sistema busca los manuales relevantes y se los pasa al LLM para que responda con esa información.

Por qué es importante: Los LLM no saben nada de tu empresa. Con RAG les das el contexto que necesitan.

Embedding

Representación numérica del significado de un texto. Convierte palabras en números que el ordenador puede comparar. Un modelo LLM no entiende palabras. cuando se añade un documento a un sistema RAG, analiza las palabras y según su significado, le asigna un vector. de esa manera, un grupo de vectores con valores similares, tienen una relación semántica, por lo que recuperar o buscar la informacion resulta más ágil.

Para qué sirve: Buscar documentos similares, encontrar información relevante.

Vector Database

Base de datos especializada en guardar y buscar embeddings. Lo que comentabamos antes.

Ejemplos: Qdrant, Pinecone, ChromaDB.

Modelo local vs Cloud

Cloud: Usas APIs de OpenAI, Anthropic, Google… Pagas por uso, necesitas internet.
Local: El modelo corre en tu ordenador. Sin coste por uso, sin enviar datos fuera, pero necesitas hardware.

Mi caso: Uso local (LM Studio + Qwen) porque trabajo con datos de empresa y no quiero que salgan de mi red. Además, para las tareas/procesos que quiero automatizar, no necesito un Ferrari, me sirve un Twingo.

Cuantización

Técnica para comprimir modelos y que usen menos recursos. Un modelo Q4 usa menos memoria que el original, con algo de pérdida de calidad.

Por qué importa: Me permite correr modelos de 7B parámetros en mi portátil con 8GB de VRAM.

Esto es solo el principio

Hay muchos más conceptos (fine-tuning, function calling, context window…) pero con estos puedes empezar a entender la mayoría de tutoriales y documentación.

En los próximos artículos iré usando estos términos y explicando cómo los aplico en la práctica.

Si algo no queda claro, pregunta en los comentarios.