Comment le nouveau modèle d’IA Claude 3 d’Anthropic se compare-t-il

Comment le nouveau modèle d’IA Claude 3 d’Anthropic se compare-t-il

La nouvelle intelligence artificielle (IA) d’Anthropic Claude 3 modèles battre ses concurrents dans de nombreux domaines, ont déclaré les experts à PYMNTS.

La société, qui a publié les modèles lundi 4 mars, affirme que Claude 3 Opus – le plus avancé parmi les nouveaux modèles – a surpassé à la fois le GPT-4 d’OpenAI et le Gemini Ultra de Google dans les évaluations de référence de l’industrie. Les évaluations couvraient des domaines tels que les connaissances de premier cycle, le raisonnement de niveau supérieur et les mathématiques de base.

Les nouveaux modèles témoignent de l’intensification de la concurrence entre les entreprises d’IA pour faire progresser leurs technologies dans un secteur de plus en plus brûlant.

« Claude surpasse GPT-4 dans presque tous les domaines » Richard GardnerPDG d’une société de conseil en technologie Modulea déclaré à PYMNTS dans une interview.

« Cependant, nous pensons que la couche d’alignement de Claude est trop restrictive. Cela dit, la couche d’alignement de GPT-4 devient également trop restrictive », a-t-il déclaré, ajoutant qu’il préférait utiliser des modèles open source.

Les nouvelles fonctionnalités d’Anthropic

Les nouveaux outils d’IA d’Anthropic au sein de la famille Claude 3 s’appellent Opus, Sonnet et Haiku. Les modèles Sonnet et Haiku sont plus simples et moins chers qu’Opus. Sonnet et Opus sont disponibles dans 159 pays, et Haiku sortira bientôt, a indiqué Anthropic. La société n’a pas précisé combien de temps ni combien il a coûté pour développer Claude 3, mais a mentionné que des sociétés comme Table à air et Asanas aidé à tester les modèles.

Pour la première fois, Anthropic permet aux utilisateurs d’analyser différents types de données, notamment des images, des graphiques et des documents, grâce à sa nouvelle fonctionnalité de support multimodal.

Lire aussi  L'église de la ville que le vicaire de Dibley's Dawn French appelait autrefois sa maison interdit les femmes vicaires

Les tests montrent que Claude 3 est meilleur dans la création de code source que d’autres modèles, Caleb Moorele co-fondateur et directeur de la technologie chez une société de logiciels Darwinium, a déclaré à PYMNTS dans une interview.

Comparer les modèles d’IA peut être délicat, Ilia Badeevresponsable de la science des données chez Groupe Trévolutionune société de services de voyages qui utilise l’IA, a déclaré à PYMNTS dans une interview.

“Les gens s’appuient souvent sur des tests publics à des fins de comparaison, mais ces tests sont assez abstraits et ne reflètent pas toujours des scénarios réels”, a déclaré Badeev. « Ce n’est pas parce qu’un modèle excelle dans certains tests qu’il sera parfait pour vos tâches uniques. »

Choisir des modèles d’IA

Un point important à considérer lors du choix d’un modèle d’IA est le coût, a souligné Badeev. Par exemple, Claude 3 Opus vous coûtera 75 $ pour un million de jetons, soit bien plus que GPT-4 Turbo, au prix de 30 $ pour le même volume.

Gardner a déclaré que presque tous les modèles peuvent être ajustés pour prendre en charge un cas d’utilisation métier spécifique. Certains modèles peuvent être meilleurs que d’autres pour des tâches particulières, mais cela est principalement dû à un réglage précis, a-t-il noté, citant des applications spécialement conçues pour gérer les notes cliniques ou pour aider les travailleurs de la santé.

Les entreprises devraient choisir un modèle d’IA basé sur la précision, la vitesse, la confidentialité, la facilité de déploiement ou de maintenance et le coût, a déclaré Gardner, ajoutant que les modèles open source offrent aux utilisateurs plus de confidentialité.

Lire aussi  Inde vs Angleterre – Tableau de bord et statistiques – L’Angleterre en Inde

Pour les rédacteurs créatifs, les capacités de GPT-4 à générer du texte pourraient être plus utiles, Michael Oglodekle directeur de la technologie chez Lierre.aia déclaré à PYMNTS dans une interview. D’un autre côté, si un utilisateur vise l’exactitude et le maintien de la cohérence de la marque, Gemini 1, qui met l’accent sur la véracité et la sécurité, pourrait être le choix préférable. Et pour les utilisateurs qui doivent traiter des demandes complexes avec précision, Claude 3 pourrait offrir des avantages.

“Dans la mesure du possible, testez les modèles directement dans votre application”, a déclaré Oglodek. « Les benchmarks sont informatifs, mais leur utilisation dans le monde réel donne l’image la plus précise. »

Pour toute la couverture PYMNTS AI, abonnez-vous au quotidien Bulletin d’information sur l’IA.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick