Anthropic Claude 3.5 Sonnet vs OpenAI GPT-4o: Quin és millor?

Home i dona posen darrere de la paret taronja clara

Anthropic va ser fundada per Dario i Daniela Amodei el 2021.Cortesia Anthropic.

Antròpic, un A.I. La startup fundada per antics enginyers d'OpenAI ahir (20 de juny) va llançar Claude 3.5 Sonnet, la seva IA més potent. model encara. El nou model no només és el doble de la velocitat del seu predecessor, Claude 3 Opus, llançat fa només tres mesos, sinó que supera el GPT-4o d'OpenAI en nombroses mesures de raonament, codificació i comprensió visual, segons la companyia. Amb el llançament d'avui, estem fent un pas cap al que creiem que podria ser un canvi significatiu en la nostra interacció amb la tecnologia, va dir el director general i cofundador d'Anthropic, Dario Amodei, en un comunicat.

Anthropic s'ha posicionat com un dels OpenAI rivals primaris. Va ser fundada l'any 2021 per Dario Amodei i la seva germana, Daniela. Tots dos van treballar anteriorment a OpenAI, supervisant respectivament la investigació i les seves iniciatives polítiques de seguretat i polítiques, i va deixar l'empresa el 2020 per les preocupacions sobre la seva direcció i la manca de salvaguardes.

Dario Amodei va suggerir llançaments ràpids de models en un futur proper. El llançament de Claude 3.5 Sonnet aviat serà seguit de nous llançaments a la família Claude. El nostre objectiu és millorar substancialment la corba de compensació entre intel·ligència, velocitat i cost, i tenim previst llançar Claude 3.5 Haiku i Claude 3.6 Opus a finals d'aquest any, alhora que seguim la nostra investigació de seguretat per garantir que aquests sistemes segueixin sent segurs, va dir el CEO. Anthropic també està explorant capacitats centrades en la memòria que personalitzaran encara més els models per recordar les preferències específiques dels usuaris i les funcions d'interacció.

signe solar del 12 de febrer

Actualment, la startup amb seu a San Francisco presumeix 375 empleats, en comparació amb la plantilla d'OpenAI. aproximadament 2.000. La ràfega de llançaments d'Anthropic indica que està intentant mantenir-se al dia en una IA de ritme ràpid. carrera armamentística amb OpenAI, que va debutar el GPT-4o al maig. Així és com s'apilen els models més nous de les dues empreses:

Claude surt al capdavant de lectura, codificació i matemàtiques

A més de mostrar millores en l'humor, els matisos i l'escriptura amb una veu natural i relacionable, Anthropic va dir que el seu model més recent supera GPT-4o en els punts de referència en raonament, coneixement i competència de codificació.

Claude 3.5 Sonnet supera lleugerament el GPT-4o en raonament de grau, codi, matemàtiques multilingües i raonament sobre el text, segons la posada en marxa . GPT-4o, per la seva banda, mostra habilitats superiors en la resolució de problemes matemàtics.

kristen kish cap

Malgrat els impressionants resultats de Claude, A.I. Els punts de referència dels models no s'han de prendre massa seriosament com a mesura de les capacitats degudes a l'escepticisme pel que fa al seu enfocament estret i la seva incapacitat per transmetre com interactuen els individus mitjans amb els models.

Superant el GPT-4o com a model visual

Una altra sèrie de punts de referència mostren les millores de Claude en la comprensió visual. Anthropic va dir que el seu nou model supera el GPT-4o quan es tracta d'entendre visualment matemàtiques, diagrames científics, gràfics i documents. Aquestes característiques són de particular importància per als serveis minoristes, logístics i financers, que sovint són capaços d'obtenir més informació d'una imatge, gràfic o il·lustració que només del text, segons l'empresa.

Set antròpic per integrar la I.A. al lloc de treball

El nou model d'Anthropic també estrenarà una funció coneguda com a Artefactes que el diferencia dels models competidors. Crearà un espai de treball integrat que permetrà als usuaris editar i interactuar directament amb el contingut, com ara correus electrònics, codi o documents, generats per Claude. La nova funció representa el desig d'Anthropic de servir les empreses transformant Claude d'una IA conversacional. a un entorn de treball col·laboratiu.

la ciutat perduda

Tots dos models estan disponibles sense cap cost

La versió web i l'aplicació de Claude 3.5 Sonnet estarà disponible sense cap cost. Mentrestant, els subscriptors del pla Claude Pro i Team podran accedir al model amb límits de tarifes més elevats. Aquest moviment segueix un estàndard establert per OpenAI, que va llançar GPT-4o a principis d'any de manera gratuïta i amb més capacitats per als usuaris de pagament.

Prioritzar els protocols de seguretat

Claude va ser sotmès a proves de seguretat rigoroses, segons Anthropic, que va proporcionar el model a l'Institut de seguretat d'intel·ligència artificial del Regne Unit per a avaluacions de seguretat prèvies al desplegament. Mentrestant, OpenAI ha estat criticada en els últims mesos per part d'antics empleats que afirmen que l'empresa no ho és prioritzar els protocols de seguretat . Jan Leike, que anteriorment va dirigir un equip de seguretat a OpenAI que des de llavors s'ha dissolt, va deixar l'empresa al maig i des de llavors s'ha incorporat a Anthropic.

Crear sistemes que no només siguin capaços, sinó també fiables, segurs i alineats amb els valors humans és un repte complex, va dir Dario Amodei. No tenim totes les respostes, però ens dediquem a treballar aquests problemes amb reflexió i responsabilitat.