Cerebras lance la tournée de présentation pour l'IPO, visant 115 à 125 dollars par action

Cerebras Systems commencera à présenter ses actions aux investisseurs lundi, avec l’intention de vendre des parts à un prix compris entre 115 et 125 dollars chacune, selon une personne au courant des plans qui s’est confiée à Reuters.

Le fabricant de puces d’intelligence artificielle tente d’entrer en bourse pour la deuxième fois. La société avait annulé sa première tentative en octobre de l’année dernière.

Cerebras a publié des résultats financiers plus solides pour l’année se terminant le 31 décembre. La société a réalisé un chiffre d’affaires de 510 millions de dollars, en hausse par rapport à 290,3 millions de dollars l’année précédente. Elle a également enregistré un bénéfice de 1,38 dollar par action, contre une perte de 9,90 dollars par action l’année précédente.

Morgan Stanley, Citigroup, Barclays et UBS gèrent la vente d’actions.

L’industrie connaît une mutation

La stratégie de Cerebras n’est pas aléatoire. L’industrie de l’IA opère un changement, passant du développement de nouveaux modèles d’IA à leur utilisation concrète. Ce changement représente une opportunité en or pour les petites entreprises rivalisant avec le monopole de Nvidia (NASDAQ : NVDA). Comme l’a rapporté Cryptopolitan, même OpenAI n’est pas convaincu par le matériel d’inférence de Nvidia.

Cela s’explique par le fait que faire fonctionner des modèles d’IA, appelés inférence, nécessite des capacités différentes de celles de leur entraînement. Cela ouvre des opportunités pour des fabricants de puces spécialisés de trouver leur place sur le marché. Traiter de gros lots d’informations demande un équilibre différent entre puissance de calcul, mémoire et vitesses de transfert de données par rapport à l’utilisation d’un chatbot IA ou d’un assistant de codage.

Cette diversité de besoins a rendu le marché de l’inférence plus varié. Certaines tâches fonctionnent mieux avec des puces graphiques traditionnelles, tandis que d’autres nécessitent un équipement plus avancé.

L’achat de Groq par Nvidia en décembre dernier pour 20 milliards de dollars illustre cette évolution. Groq a conçu des puces équipées de mémoire SRAM rapide capable de traiter les réponses IA plus vite que les puces graphiques standard. Mais l’entreprise a eu du mal à évoluer car ses puces avaient une puissance de calcul limitée et étaient construites sur une technologie plus ancienne.

Nvidia a résolu ce problème en divisant le travail. Elle utilise ses puces graphiques classiques pour la partie lourde de la génération de réponses IA, appelée pré-remplissage, tout en utilisant les puces de Groq pour l’étape de décodage plus rapide qui nécessite moins de calculs mais un accès rapide aux données.

D’autres grandes entreprises font quelque chose de similaire. Amazon Web Services a annoncé son propre système divisé peu après une grande conférence technologique. Il combine ses puces personnalisées Trainium pour le pré-remplissage avec les puces de Cerebras, de la taille d’une galette de wafer, pour les opérations de décodage.

Intel a également rejoint le mouvement, en dévoilant ses plans pour associer des puces graphiques à des processeurs d’une startup appelée SambaNova. Les puces graphiques géreront le pré-remplissage, tandis que celles de SambaNova s’occuperont du décodage.

La majorité des petites entreprises de puces ont trouvé leur succès dans le travail de décodage. La mémoire SRAM ne contient pas beaucoup d’informations, mais elle est extrêmement rapide. Avec suffisamment de puces, ou une très grande puce comme celles fabriquées par Cerebras, ces systèmes excellent dans les tâches de décodage. Mais les entreprises ne s’arrêtent pas là.

Les nouvelles technologies remettent en question l’approche des puces divisées

Lumai, une autre startup, a annoncé cette semaine avoir construit une puce utilisant la lumière au lieu de l’électricité pour les opérations mathématiques au cœur du travail d’IA. Cette approche consomme beaucoup moins d’énergie que les puces traditionnelles.

L’entreprise prévoit que ses systèmes Iris Tetra à venir offriront une performance d’un exaOPS en IA tout en utilisant seulement 10 kilowatts d’énergie d’ici 2029.

Les puces combinent des composants à base de lumière et électriques, mais la lumière gère la majorité du travail lors de l’inférence. Lumai prévoit d’utiliser ces puces d’abord comme remplacements autonomes des puces graphiques dans les tâches de traitement par lots. Plus tard, l’entreprise souhaite également les utiliser pour le pré-remplissage.

Tout le monde ne pense pas que diviser le travail entre différentes puces ait du sens. Tenstorrent a lancé cette semaine ses systèmes Galaxy Blackhole, et le PDG Jim Keller a critiqué cette approche.

« Chaque entreprise du secteur s’associe pour construire l’accélérateur, l’accélérateur, l’accélérateur. Les CPU exécutent le code. Les GPU accélèrent les CPU. Les TPU accélèrent les GPU. Les LPU accélèrent les TPU. Et ainsi de suite. Cela conduit à des solutions complexes qui sont peu susceptibles d’être compatibles avec les changements dans les modèles et usages de l’IA. Chez Tenstorrent, nous pensions qu’une solution plus générale et plus simple fonctionnerait », a déclaré Keller.

Les esprits crypto les plus intelligents lisent déjà notre newsletter. Vous voulez en faire partie ? Rejoignez-les.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé