Cerebras запускает роудшоу по первичному публичному размещению акций, ориентируясь на цену $115-$125 за акцию

Cerebras Systems начнет предлагать свои акции инвесторам в понедельник, планируя продать акции по цене от 115 до 125 долларов за штуку, согласно источнику, знакомому с планами, который говорил Reuters.

Производитель чипов для искусственного интеллекта пытается выйти на биржу во второй раз. Компания отменила свою первую попытку в октябре прошлого года.

Cerebras отчиталась о более сильных финансовых результатах за год, завершившийся 31 декабря. Компания получила доход в 510 миллионов долларов, что больше по сравнению с 290,3 миллиона долларов в предыдущем году. Также она получила прибыль в 1,38 доллара на акцию, в то время как в предыдущем году она терпела убытки в 9,90 доллара на акцию.

Morgan Stanley, Citigroup, Barclays и UBS занимаются продажей акций.

Индустрия меняется

Стратегия Cerebras не случайна. Индустрия искусственного интеллекта переходит от разработки новых моделей ИИ к их использованию на практике. Этот сдвиг — золотая возможность для небольших компаний, конкурирующих с монополией Nvidia (NASDAQ: NVDA). Как сообщает Cryptopolitan, даже OpenAI не уверена в аппаратных средствах Nvidia для вывода моделей.

Это связано с тем, что запуск моделей ИИ, известных как inference, требует иных возможностей, чем их обучение. Это создает возможности для специализированных производителей чипов занять свою нишу на рынке. Обработка больших объемов информации требует другого баланса вычислительной мощности, памяти и скорости передачи данных, чем запуск чат-бота или помощника по программированию.

Это разнообразие требований сделало рынок inference более разнообразным. Некоторые задачи лучше выполняются на традиционных графических чипах, в то время как другие требуют более продвинутого оборудования.

Покупка Nvidia компании Groq в декабре прошлого года за 20 миллиардов долларов показывает, как это реализуется. Groq создала чипы с быстрой SRAM-памятью, которые могли обрабатывать ответы ИИ быстрее стандартных графических чипов. Но компании было трудно масштабировать производство, потому что их чипы имели ограниченную вычислительную мощность и были основаны на устаревших технологиях.

Nvidia решила эту проблему, разделив работу. Она использует свои обычные графические чипы для тяжелых вычислений при генерации ответов ИИ, называемых prefill, а чипы Groq — для более быстрого этапа декодирования, который требует меньших вычислений, но нуждается в быстром доступе к данным.

Другие крупные компании делают что-то подобное. Amazon Web Services объявила о своей собственной системе разделения сразу после крупной технологической конференции. Она сочетает свои собственные чипы Trainium для prefill с чипами Cerebras размером с пластину для операций декодирования.

Intel тоже присоединилась, объявив о планах сочетать графические чипы с процессорами от стартапа SambaNova. Графические чипы будут заниматься prefill, а чипы SambaNova — декодированием.

Большинство небольших компаний по производству чипов добились успеха в области декодирования. SRAM-память содержит немного информации, но очень быстра. При достаточном количестве чипов или очень большом чипе, как у Cerebras, эти системы превосходны в задачах декодирования. Но компании не останавливаются на этом.

Новые технологии бросают вызов разделенному подходу к чипам

Lumai, еще один стартап, на этой неделе объявил, что создал чип, использующий свет вместо электричества для математических операций, лежащих в основе работы ИИ. Этот подход потребляет значительно меньше энергии, чем традиционные чипы.

Компания ожидает, что ее будущие системы Iris Tetra обеспечат exaOPS производительности ИИ при использовании всего 10 киловатт энергии к 2029 году.

Чипы сочетают световые и электрические компоненты, но во время inference большую часть работы выполняет свет. Lumai планирует сначала использовать эти чипы как самостоятельные заменители графических чипов для пакетной обработки. Позже компания хочет использовать их и для prefill.

Не все считают, что разделение работы между разными чипами имеет смысл. Tenstorrent на этой неделе представила свои системы Galaxy Blackhole, и генеральный директор Jim Keller раскритиковал этот подход.

«Каждая компания в индустрии объединяется для создания ускорителей ускорителей ускорителей. ЦПУ выполняют код. Графические процессоры ускоряют ЦПУ. TPU ускоряют графические процессоры. LPU ускоряют TPU. И так далее. Это приводит к сложным решениям, которые вряд ли будут совместимы с изменениями в моделях и применениях ИИ. В Tenstorrent мы думали, что более универсальное и простое решение сработает лучше», — сказал Келлер.

Самые умные крипто-эксперты уже читают нашу рассылку. Хотите присоединиться? Присоединяйтесь к ним.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено