ChatGPT 4.1 Puntos de referencia tempranos en comparación con Google Gemini

ChatGPT 4.1 ahora se implementa, y es un salto significativo para GPT 4O, pero no puede superar la referencia definida por Google Gemini.

Operai ayer confirmado Que los desarrolladores con acceso a API pueden probar hasta tres nuevos modelos: GPT – 4.1, GPT – 4.1 Mini y GPT – 4.1 Nano.

Dependiendo de los puntos de referencia, estos modelos son mucho mejores que GPT-4O y GPT-4O existentes, especialmente en la codificación.

Por ejemplo, GPT – 4.1 puntúa 54.6% en SWE -Bench Verificado, que es mejor que GPT -4O de 21.4% y 26.6% en comparación con GPT – 4.5. Tenemos resultados similares en otras herramientas de análisis comparativo compartidas por OpenAI, pero ¿cómo se enfrenta con los modelos Gemini?

Chatgpt 4.1 puntos de referencia tempranos

Según las referencias común Por StageHand, que es un marco de automatización para el navegador listo para la producción, Gemini 2.0 Flash tiene la tasa de error más baja (6.67%), así como el puntaje exacto más alto (90%), y también es barata y rápida.

Por otro lado, GPT – 4.1 tiene una tasa de error más alta (16.67%) y cuesta más de 10 veces más que Gemini 2.0 Flash.

Otras variantes GPT (como “nano” o “mini”) son más baratas o más rápidas pero no tan precisas como GPT-4.1

En otros datos común Por Pierre Bongrand, quien es un científico que trabaja en ARN en Harward, GPT – 4.1 ofrece una menor rentabilidad que los modelos competidores.

Es un factor importante porque GPT4.1 es más barato que el ChatPPT 4O.

Modelos como Gemini 2.0 Flash, Gemini 2.5 Pro e incluso Deepseek o O3 Mini están más cerca de o en la frontera, lo que sugiere que ofrecen un rendimiento más alto a un costo más bajo o comparable.

Al final, aunque GPT – 4.1 siempre funciona como una opción, está claramente eclipsada por alternativas más baratas o más competentes.

Los puntos de referencia de codificación muestran que GPT-4.1 está rezagado detrás de Gemini 2.5

Observamos resultados similares en los puntos de referencia de codificación, con Ayuda Polyglot Listado GPT-4.1 con un puntaje del 52%, mientras que Gemini 2.5 tiene kilómetros de anticipación con un 73%.

También es importante tener en cuenta que GPT-4.1 es un modelo no sazonante, y siempre es uno de los mejores modelos de codificación.

GPT-4.1 está disponible a través de API, pero puede usarlo de forma gratuita si se registra en Ai windsurfing.

Noticias Fintech Latam

ChatGPT 4.1 Puntos de referencia tempranos en comparación con Google Gemini

Chatgpt 4.1 puntos de referencia tempranos

Los puntos de referencia de codificación muestran que GPT-4.1 está rezagado detrás de Gemini 2.5

Notas destacadas

Por qué las fintech LATAM ya no pueden crecer a pérdida

Due diligence: el nuevo mantra de las fintech

Qué aprendieron los inversores después de FTX

Titulos

Chatgpt 4.1 puntos de referencia tempranos

Los puntos de referencia de codificación muestran que GPT-4.1 está rezagado detrás de Gemini 2.5

Artículos relacionados

No te lo pierdas