Todos los Agregadores de Modelos IA

OpenRouter

Free 340+

Peculiaridades

El más completo del mercado: 340+ modelos de todos los proveedores.
Un solo API key para acceder a Claude, GPT, Gemini, Llama, Mistral, etc.
Muchos modelos gratuitos con badge :free.
Soporta streaming, vision, function calling en la mayoría de modelos.
Pago por uso con precios casi idénticos a los oficiales (markup mínimo).

                🎯 Ideal para: Tener un único punto de acceso a cualquier modelo sin gestionar múltiples keys.
            

Modelos Destacados

Modelo	Descripción
Claude 3.5 Sonnet	Razonamiento profundo	Top
GPT-4o	Multimodal generalista	Vision
Gemini 2.5 Pro	Contexto 1M tokens	Vision
DeepSeek V3	Razonamiento económico	Free
Mistral Large	Multilingüe robusto	Premium

ZenMux

zenmux.ai

Free 136

Peculiaridades

Seguro de calidad: compensación automática si el output es malo o lento.
Doble protocolo: compatible con OpenAI SDK y Anthropic SDK simultáneamente.
4 modelos gratuitos con sufijo -free.
Routing inteligente con failover automático entre modelos.
Enfoque en producción confiable con garantía de calidad.

                🎯 Ideal para: Producción donde la calidad es crítica y quieres respaldo automático sin intervención manual.
            

Modelos Destacados

Modelo	Descripción
Claude 3.5 Sonnet	Razonamiento profundo	Top
GPT-4o	Multimodal generalista	Vision
DeepSeek V3	Razonamiento económico	Free
Gemma 3	Ligero y eficiente	Free
Llama 4 Maverick	Open-source potente	Free

Groq

groq.com

Free 🏆 18+

Peculiaridades

Hardware LPU (Language Processing Unit) propio → velocidad inigualable.
560–1000 tokens/segundo de velocidad de inferencia.
Mejor free tier del mercado: 18+ modelos sin costo.
Whisper (STT) y TTS incluidos gratis.
Rate limits generosos en el plan gratuito.

                🎯 Ideal para: Tareas que necesitan respuesta ultrarrápida. La mejor opción gratuita del ecosistema.
            

Modelos Destacados

Modelo	Descripción
Llama 4 Scout	Open-source rápido	Free
Gemma 3	Ligero y eficiente	Free
DeepSeek Distill	Razonamiento destilado	Free
Mistral 7B	Pequeño y rápido	Free
Qwen 2.5 72B	Gran rendimiento	Free

Together AI

together.ai

Trial 26+

Peculiaridades

Batch API con 50% de descuento sobre el precio normal.
Dynamic rate limits que se adaptan al tráfico.
Modelos open-source siempre actualizados (últimos checkpoints).
Soporta chat, image generation, video y audio.
Créditos iniciales gratuitos al registrarse (no hay free tier permanente).

                🎯 Ideal para: Cargas de trabajo predecibles con batch processing para ahorrar hasta 50%.
            

Modelos Destacados

Modelo	Descripción
Llama 4 Maverick	Open-source potente	Top
DeepSeek V3	Razonamiento eficiente	Premium
Qwen 2.5 72B	Multilingüe robusto	Premium
Gemma 3	Ligero y rápido	Open
Stable Diffusion 3.5	Generación de imágenes	Image

DeepInfra

deepinfra.com

Pago 50+

Peculiaridades

200 concurrent requests por API key (muy alto).
Auto-scaling: los modelos escalan según demanda sin intervención.
Despliegue de modelos personalizados desde $0.89/hora.
Soporta DeepSeek, Qwen, Llama, Gemma, Gemini, Claude y más.
Sin free tier: todo es pago por uso con precios competitivos.

                🎯 Ideal para: Producción empresarial que necesita escalar con alta concurrencia y modelos custom.
            

Modelos Destacados

Modelo	Descripción
DeepSeek V3	Razonamiento eficiente	Top
Qwen 2.5 72B	Multilingüe potente	Premium
Llama 4 Maverick	Open-source rápido	Premium
Gemma 3	Ligero y eficiente	Open
Gemini 2.5 Pro	Contexto 1M	Vision

Fireworks AI

fireworks.ai

Pago 80+

Peculiaridades

Inferencia ultrarrápida con FireFunction v2 (optimizado para tool calling).
Especializado en function calling: la mejor plataforma para agentes.
80+ modelos entre open-source y propietarios.
Soporta fine-tuning y despliegue de modelos propios.
Compatible con OpenAI SDK (drop-in replacement).

                🎯 Ideal para: Agentes que usan muchas tool calls y necesitan function calling ultrarrápido.
            

Modelos Destacados

Modelo	Descripción
Llama 4 Maverick	Open-source rápido	Top
FireFunction v2	Function calling especializado	Propio
DeepSeek V3	Razonamiento eficiente	Premium
Qwen 2.5 72B	Multilingüe robusto	Open
Mistral Nemo	Ligero con tool calling	Open

Replicate

replicate.com

Trial Miles

Peculiaridades

Factura por GPU-time (segundos de GPU), no por tokens.
Miles de modelos open-source subidos por la comunidad.
Puedes desplegar tus propios modelos usando Cog (su herramienta open-source).
Especializado en modelos de imagen, video y audio nicho.
Trial limitado con créditos iniciales gratuitos.

                🎯 Ideal para: Modelos de imagen/video nicho, o desplegar tus propios modelos con Cog.
            

Modelos Destacados

Modelo	Descripción
Stable Diffusion 3.5	Imagen generativa	Image
Flux.1 Pro	Imagen de alta calidad	Image
Llama 4 Maverick	Chat open-source	Chat
MusicGen	Generación musical	Audio
Mistral 7B	Chat ligero	Open

Novita AI

novita.ai

Free 60+

Peculiaridades

60+ modelos LLM, image generation y video.
1 modelo gratuito permanente: Nex-N2-Pro.
También ofrece GPU instances y Agent Sandbox para desarrollo.
Alternativa económica a OpenRouter con precios competitivos.
API compatible con OpenAI SDK (fácil migración).

                🎯 Ideal para: Alternativa económica a OpenRouter con buen catálogo y GPU instances.
            

Modelos Destacados

Modelo	Descripción
Nex-N2-Pro	Modelo gratuito propio	Free
DeepSeek V3	Razonamiento eficiente	Premium
Llama 4 Maverick	Open-source rápido	Premium
Qwen 2.5 72B	Multilingüe robusto	Open
Stable Diffusion	Generación de imágenes	Image

🧠 Todos los Agregadores de Modelos IA

OpenRouter

ZenMux

Groq

Together AI

DeepInfra

Fireworks AI

Replicate

Novita AI