DeepSeek V3.1 y Qwen3: dos rutas chinas hacia la próxima generación de IA

Dos familias de modelos compiten por definir el estándar de la IA aplicada: DeepSeek V3.1, que combina un “modo de pensamiento” razonado con ejecución rápida, y Qwen3 de Alibaba, que multiplica la eficiencia con Mixture-of-Experts y variantes enfocadas a código, razonamiento y traducción. Detrás de las métricas hay una pregunta de fondo: ¿cómo escalamos capacidades sin disparar los costos ni perder control sobre la toma de decisiones?

Inteligencia Artificial y Desarrollo.14 de septiembre de 2025Redacción MBARedacción MBA
deepseek 3
Fuente: Deepseek

La carrera por los modelos de propósito general dejó de ser un catálogo de “benchmarks” para convertirse en una discusión operativa sobre arquitecturas, costos, latencia y gobernanza. China irrumpió con dos propuestas robustas que, más que “una opción más”, plantean dos filosofías de diseño con implicancias directas para empresas, gobiernos, pymes y desarrolladores. DeepSeek V3.1 apuesta a un modelo híbrido capaz de alternar entre razonamiento explícito (cuando una tarea requiere pasos intermedios) y generación directa (cuando basta la respuesta breve), mientras Qwen3consolida el enfoque Mixture-of-Experts (MoE) con una familia de tamaños y “sabores” que buscan máxima relación costo-prestaciones en producción. La competencia ya no se libra sólo en papers: se mide en tickets de soporte, consumo de GPU y fiabilidad al llamar herramientas externas, como si el “cerebro” de la IA empezara a aprender a trabajar en equipo con los sistemas legados. 


DeepSeek V3.1: un único modelo, dos modos de ejecución


La actualización V3.1 se presenta como una hibridación de inferencia: el mismo modelo puede operar en modo de pensamiento (explicita cadenas de razonamiento para problemas complejos) o en modo directo (prioriza velocidad y costo), conmutando mediante plantillas de chat. Esto importa por una razón práctica: el razonamiento paso a paso suele ser más caro; poder activarlo selectivamente evita pagar “precio premium” cuando no hace falta. Además, V3.1 introduce mejoras en el uso de herramientas y tareas de agente, un área crítica cuando el modelo tiene que orquestar acciones (buscar, ejecutar código, llamar APIs) y no sólo escribir texto. 

Más allá de la narrativa, hay señales concretas de industrialización. La disponibilidad gestionada en plataformas de nube señala contexto largo muy por encima del promedio y límites de salida generosa, atributos valiosos para contratos, catálogos extensos, logs o integraciones que requieren “recordar” mucho dentro de una misma sesión. Que un proveedor mayor liste context length de seis cifras coloca el foco donde realmente se juega productividad: menos cortes, menos “pérdidas de memoria” y menos ingeniería artesanal para trocear documentos. 

En la capa de hardware y eficiencia, las descripciones públicas de la serie V3 hablan de una gran MoE con una fracción relativamente pequeña de parámetros “activos” por consulta, más técnicas de cuantización y escalado que aceleran la inferencia sin degradar calidad de manera visible para la mayoría de usos. El efecto práctico es claro: respuestas más baratas por token y latencias más estables en cargas reales, especialmente cuando se combina con “modo directo”. Finalmente, hay un elemento empresarial poco glamoroso pero decisivo: políticas de precios y cambios anunciados a corto plazo, que obligan a revisar presupuestos y elasticidad del consumo si el uso crece. 


Qwen3 (Alibaba): la familia como estrategia de producto


Qwen3 no es un solo modelo: es un portafolio. La propuesta de Alibaba combina modelos base y variantes orientadas a razonamiento, programación y traducción, con el sello MoE para mantener controlados los costos de inferencia. La compañía describe la serie como “híbrida” en el sentido de integrar razonamiento y tareas generales, y la empuja como código abierto con soporte amplio de frameworks de inferencia y despliegue en la nube. Esto no es marketing: cuanto más fácil es cambiar de runtime o proveedor, más baja la fricción para pilotos y migraciones.

El roadmap reciente se vuelve particularmente interesante con Qwen3-Next, donde el equipo enfatiza dos tendencias que ya marcan agenda: escalado del contexto y escalado total de parámetros, pero con una obsesión por la eficiencia que se traduce en variantes de decenas a cientos de miles de millones de parámetros “totales”, de los cuales sólo una porción se activa por consulta. Algunas configuraciones reclaman mejoras de potencia-costo de un orden de magnitud frente a iteraciones previas, señal de que la batalla por “más por menos” se acelera. 

Qwen3, además, llega con sabores especializados —por ejemplo, los orientados a coding— que apuntan a un dolor real de las empresas: pasar de “asistentes de texto” a agentes de desarrollo que entienden repositorios, respetan convenciones internas y generan cambios aplicables. El hecho de que Alibaba empuje la distribución en su Model Studio y otros proveedores reduce el “lock-in” y facilita comparativas A/B en la vida real, no sólo en tableros de métricas.

Qwen 3


Dos filosofías de diseño: orquestación del pensamiento vs. eficiencia orquestada


Si tuviéramos que traducir estas aproximaciones a una metáfora, DeepSeek V3.1 se comporta como un consultor que decide cuándo pensar en voz alta y cuándo ejecutar sin hacerte perder tiempo; Qwen3, en cambio, parece una firma con muchos especialistas que, según el caso, convoca a los adecuados para resolver más rápido y barato. En un mundo de presupuestos finitos y tiempos de respuesta acotados, ambas aproximaciones convergen en el mismo objetivo: optimizar el costo de acierto.

La cuestión no es sólo filosófica. La trazabilidad del razonamiento importa para sectores regulados, auditorías internas o contextos educativos; la eficiencia MoE, por su parte, importa cuando hay que escalar a miles de usuarios concurrentes sin que el costo de GPU se dispare. De ahí que veamos, por un lado, conmutadores de “modo pensamiento” en la API, y por el otro, familias completas para ajustar tamaño y costo a cada caso de uso. 


Rendimiento, contexto y coste: lo que de verdad mueve la aguja



Una de las ventajas competitivas que empieza a decidir adopciones es la longitud de contexto. Poder leer, razonar y escribir con cientos de miles de tokens en una sola pasada habilita flujos antes imposibles: desde contratos y normativas extensas hasta documentación técnica y bases de conocimiento sin trocear. Cuando un proveedor mayor publica 163.840 tokens de contexto —más salida extensa— el mensaje es transparente: la memoria operativa ya no será el cuello de botella, y eso desplaza el esfuerzo a curación de datos y diseño de prompts más sobrios. 

El otro eje es el coste por tarea. Con MoE bien entrenado y cuantización moderna, no hace falta “encender toda la fábrica” en cada consulta: bastan subconjuntos de expertos que se activan selectivamente. De ahí los reclamos de mayor potencia por fracción del costo en algunas variantes recientes de Qwen3-Next, y las descripciones de V3.1 como un MoE enorme con pocos expertos activos en cada paso, apoyado en micro-escalado numérico para exprimir hardware. En términos llanos: menos GPU-segundos por respuesta útil. 

Nano Banana GeminiGoogle Nano Banana, lo que todos quieren probar


Implicaciones para empresas, pymes y desarrolladores


Para los equipos de producto, el modo híbrido de DeepSeek reduce la tentación de “encender el pensamiento” siempre. Se puede automatizar: si la tarea es repetitiva y no ambigua (extraer campos, traducir formatos, generar resúmenes cortos), modo directo; si hay estrategia, ambigüedad o necesidad de explicabilidad, modo de pensamiento. Para pymesy equipos no sobredimensionados, esto significa controlar factura sin resignar calidad cuando hace falta elevar el estándar.

Qwen3, por su parte, se siente natural en organizaciones que prefieren alinear tamaño de modelo a la tarea: un 30B-80B para backoffice y agentes internos, y un “Max/Next” para demandas con mayor complejidad o carga. El énfasis de Alibaba en variantes de coding y traducción lo vuelve especialmente útil para DevOps, migraciones y localizaciónmultilingüe, donde ahorrar minutos por ticket equivale a ahorrar días al mes en el total. 


Gobernanza, apertura y ecosistema


La “apertura” ya no es un adjetivo sino una decisión de arquitectura. Qwen3 pone repositorio público, guías multi-runtime y despliegue en distintos proveedores, lo que habilita pruebas comparativas y portabilidad si cambian las condiciones comerciales. DeepSeek, mientras tanto, amplía parrilla de disponibilidades e integra su modelo en entornos de nube de terceros, una señal de madurez comercial: cuando un modelo entra a catálogos de cloud con SLAs y cuotas, se vuelve comprable por áreas no técnicas. Para quienes están cansados de “ensayos eternos”, esto simplifica el “sí” de compras. 

También es relevante el componente macro: ambos programas se desarrollan en un contexto geopolítico donde la soberanía tecnológica y el control de costos de inferencia pesan tanto como el último dígito del benchmark. No es casual ver ajustes de pricing y expansión de catálogos en cuestión de semanas: el juego es capturar desarrolladoreshoy para retener workloads mañana. 


Qué mirar en los próximos meses:


-Latencia bajo carga real, no de laboratorio. La promesa MoE y los “modos” de razonamiento deben sostenerse cuando cien agentes llaman herramientas en paralelo.
-Fiabilidad de tool-use: cuántas veces el modelo elige la herramienta correcta y maneja errores (timeouts, formatos, reintentos).
-Calidad en contexto largo: más tokens no siempre implican mejor integración de información; conviene verificar consistencia en resúmenes y citas internas.
-Costo efectivo por ticket: para customer service, code review o extracción documental, la métrica que importa es ARPU por flujo automatizado, no el precio del millón de tokens suelto.
-Ecosistema y cadencia: Qwen3 ya muestra iteraciones “Next” con saltos de eficiencia; DeepSeek viene de una secuencia rápida de releases con foco en agente. Esa velocidad de actualización debe acompañar sin romper integraciones. 


Más allá del “quién gana”: el juego de suma positiva


Comparar DeepSeek V3.1 con Qwen3 como si fueran consolas rivales pierde de vista lo esencial: ambas líneas empujan a la industria a pensar en sistemas y no en modelos aislados. El foco se desplaza de “quién saca más puntos en un benchmark” a cómo entrenamos, configuramos y gobernamos ecosistemas capaces de razonar, actuar y aprender con restricciones reales. En esa transición, el modo híbrido de DeepSeek facilita dosificar el pensamiento, y la familia MoEde Qwen3 permite dosificar la capacidad. Una herramienta para probar hipótesis con trazabilidad; otra para escalar con eficiencia. La noticia no es que haya un ganador, sino que hay opciones con personalidad.

En última instancia, lo que está en disputa no es sólo la calidad de una respuesta, sino quién controla el costo del aciertoy con qué grado de explicabilidad se toman decisiones automatizadas que afectan a personas. Si el próximo salto de productividad proviene de agentes fiables capaces de usar herramientas como profesionales, el reto no está en batir un récord efímero, sino en sostener calidad, costos y control cuando esos agentes salgan de la demo y entren a la operación. ¿Estamos listos para medirlos no por lo que “escriben”, sino por lo que hacen y lo que cuestan cuando se vuelven parte invisible de nuestros procesos?

Te puede interesar
open ai illustration

OpenAI y la IA sexualizada: impacto social, ético y oportunidades

Redacción MBA
Inteligencia Artificial y Desarrollo.18 de octubre de 2025

OpenAI abre la puerta a experiencias eróticas en sus chatbots, generando un debate sobre los riesgos y beneficios sociales, éticos y comerciales de una inteligencia artificial que se acerca cada vez más a la intimidad humana. Esta transformación redefine la relación entre usuarios y máquinas, planteando preguntas urgentes sobre regulación, salud mental y el futuro de las interacciones digitales.

Claude sonnet 4.5

Claude Sonnet 4.5 y la nueva era de la automatización en tu navegador

Redacción MBA
Inteligencia Artificial y Desarrollo.02 de octubre de 2025

Desde la llegada de los primeros asistentes virtuales hemos soñado con una IA que no solo sugiera texto, sino que conecte, automatice y ejecute tareas complejas en nuestro propio entorno de trabajo digital. Con el lanzamiento de Claude Sonnet 4.5 y su extensión para Chrome, Anthropic cumple esa promesa: un agente que controla tu navegador con la misma fluidez y precisión con la que tú lo harías.

google ai mode

Google AI Mode y la redefinición del buscador

Redacción MBA
Inteligencia Artificial y Desarrollo.01 de octubre de 2025

Google anuncia un cambio histórico en su motor de búsqueda: la llegada de AI Mode. Esta nueva era no solo replantea cómo los usuarios encuentran información, sino que también marca el inicio de un choque de titanes en la industria tecnológica, donde la inteligencia artificial ya no es un complemento, sino el centro mismo de la experiencia digital.

Lo más visto
arena ai trading

Alpha Arena: La batalla de las IA por dinero real en trading Crypto

Redacción MBA
Mercados y Finanzas.22 de octubre de 2025

Los modelos de inteligencia artificial más avanzados del mundo están apostando 10.000 dólares cada uno en criptomonedas. DeepSeek lidera con ganancias del 40%, mientras Gemini de Google se hunde con pérdidas del 55%. Esto no es un simulador: cada error cuesta dinero real, y el experimento está redefiniendo cómo pensamos sobre las finanzas.

antrophic google cloud

Anthropic y Google Cloud: la nueva carrera por el poder de la IA

Redacción MBA
El sábado

La startup de inteligencia artificial Anthropic selló un acuerdo histórico con Google Cloud para acceder a hasta un millón de TPUs en 2026. El pacto, valuado en decenas de miles de millones, reconfigura la competencia global por el dominio del cómputo y plantea interrogantes sobre sostenibilidad, concentración de poder y el futuro de la infraestructura que mueve la IA.

3I/ATLAS

3I/ATLAS: Verdades sobre el nuevo visitante interestelar

Redacción MBA
Sociedad y TecnologíaEl sábado

Descubierto por el telescopio ATLAS en Chile, este cometa proveniente de otro sistema estelar se aproxima al Sol en una trayectoria hiperbólica. Su paso ofrece una oportunidad irrepetible para estudiar materiales formados más allá de nuestro sistema solar y reflexionar sobre el lugar que ocupa la Tierra en una galaxia activa y conectada.

kapur alterego

AlterEgo: La Computadora que Escucha tus Pensamientos

Redacción MBA
Industria Tecnológica.Ayer

Más allá de la voz y el tacto, una nueva frontera en la interacción humano-máquina emerge desde el MIT. Un dispositivo que promete aumentar nuestra inteligencia, fusionando el monólogo interior con el poder de la computación y planteando interrogantes fundamentales sobre nuestro futuro cognitivo.

Queremos seguir generando contenido de alta calidad. Sumate y recibí todas las noticias de tecnología, inteligencia artificial, energía y mercados. También podrás disfrutar de sorteos y promociones (solo para seguidores) que ofrecen socios comerciales nuestros.