Paga por una API de deep research cuando lanzas miles de consultas multi-salto y no puedes permitirte ser dueño del índice, la deduplicación y la limpieza de tokens tú mismo. Construye tu propio bucle cuando el volumen es modesto y quieres control. Esa es la respuesta completa a la pregunta que r/aiagents y r/Rag rondan a mediados de 2026, y todo lo de abajo es el razonamiento y los números detrás.
Qué vende de verdad una API de deep research
Una API de deep research no es un bucle de búsqueda que podrías reconstruir sin esfuerzo. El propio equipo de Parallel, respondiendo en r/aiagents, fue directo: para agentes básicos donde no te importa la latencia, el coste ni la calidad, no notarás diferencia; las empresas que lanzan millones de búsquedas no quieren ser dueñas de esa infraestructura. Lo que alquilas son tres cosas: un índice ordenado para el contexto de un LLM en lugar de para clics humanos, procedencia de fuentes y citas, y que otro se coma la latencia y la deduplicación a escala.
Lo del índice es lo de verdad. Google ordena los resultados para que una persona haga clic en el primer enlace azul. Un índice nativo de LLM ordena los snippets por relevancia para una ventana de contexto, lo que significa menos tokens desperdiciados por consulta. A millones de consultas, el exceso de tokens por contexto irrelevante es una partida; a unos pocos miles, no lo es.
Qué cuesta de verdad el bucle casero
La versión casera es una API de búsqueda, un paso de refinamiento y una condición de parada. Golpeas un endpoint de búsqueda, lees los primeros resultados, decides si tienes suficiente, vuelves a buscar con una consulta más afilada si no. Eso es casi todo lo que hace por debajo el modo "deep research", un bucle de búsqueda más un bucle de refinamiento, como lo puso un comentarista de r/aiagents. El trabajo que asumes es la orquestación: reescritura de consultas, deduplicación, decidir cuándo parar y ensamblar las citas.
Para volumen modesto esto es barato y conservas el control. Eres dueño de los prompts, las condiciones de parada y la forma de los datos. No estás depurando un arnés opaco cuando los resultados salen raros.
Los precios de 2026, verificados
Comprobado contra las páginas de los proveedores el 2026-06-26:
- Exa: búsqueda neuronal estándar $7 por cada 1.000 (subió desde $5 en marzo de 2026), deep $12/1k, deep-reasoning $15/1k, 1.000 búsquedas gratis/mes.
- Parallel: $5 por cada 1.000 peticiones con 10 resultados incluidos, +$1/1k de resultados extra, unas 16.000 peticiones gratis.
- Tavily: 1.000 créditos gratis/mes, basic 1 crédito, advanced 2 créditos, $0.008/crédito de pago por uso.
- Una API de SERP simple (Scavio): $0.005/crédito, SERP completa 2 créditos, Reddit 2 créditos, en el plan de $30/7.000 créditos eso son unos $4.30 por cada 1.000 llamadas de SERP completa.
Los tramos deep ($12-$15/1k) son donde muerde el sobreprecio. Si tu necesidad "deep" es en realidad "busca, refina una vez, vuelve a buscar", un bucle sobre una API de $4-$5/1k lo hace por menos.
Dónde se cae el casero
Sé honesto sobre el techo. A escala real, cadenas multi-salto a través de millones de consultas, el índice gestionado se gana su tarifa. La deduplicación entre miles de fuentes, una procedencia que puedes enseñarle a un cliente y una eficiencia de tokens que se compone a lo largo de millones de llamadas son infraestructura real que de otro modo construirías y operarías. El representante de Parallel no faroleaba en esa parte.
La otra debilidad del casero es la calidad del índice. Un bucle sobre resultados con forma de Google hereda la ordenación por clic humano de Google. Para barridos bibliográficos abiertos, un índice neuronal como Exa de verdad saca a la superficie páginas que la búsqueda por palabras clave se pierde.
Una regla de decisión
Usa la prueba de coste de investigación de Scavio: estima las consultas de investigación mensuales por la tarifa del tramo deep, y luego compáralo contra una API de SERP simple más las horas de ingeniería para operar tu propio bucle.
- Por debajo de ~50.000 consultas/mes y sobre todo grounding factual: bucle casero sobre una API de SERP estructurada. Más barato, y conservas el control.
- Alto volumen, multi-salto, sensible a la procedencia (le enseñas citas a clientes): compra Parallel o Exa. Pagas por no ser dueño de la infraestructura, que es el trato correcto a esa escala.
- Descubrimiento semántico abierto ("encuéntrame todo lo parecido a esto"): la búsqueda neuronal de Exa, sin importar el volumen.
Una cosa más que el bando casero infravalora: muchas preguntas de "investigación" no son preguntas web. "Qué está diciendo realmente la gente sobre esta herramienta" es una llamada a Reddit. "¿Está este producto en tendencia?" es una llamada a Amazon o TikTok. Una API multi-plataforma como Scavio hace grounding en todas ellas detrás de una sola clave, $0.005/crédito, 50 gratis para empezar, que ninguna API de investigación solo-web alcanza. Verificado en esta sesión: una llamada a /api/v1/google con light_request:false devolvió 7 resultados orgánicos más 8 búsquedas relacionadas y el bloque de knowledge graph en 2 créditos, que es la capa de grounding sobre la que se asientan igualmente la mayoría de los bucles de investigación.
La API de deep research no es una estafa y el bucle casero no siempre es ingenuo. Elige por el volumen y por si estás haciendo grounding o investigación multi-salto de verdad. La mayoría de los agentes hacen grounding y pagan precios de investigación.