Тунъи к вопр. значительно снизилась цена, стоимость API модели ИИ снизилась на 97%

robot
Генерация тезисов в процессе

21 мая цены на API вызовы коммерческой модели и модели с открытым исходным кодом Tongyi Qianwen для разработчиков были значительно снижены. В частности, цена на входные данные для модели уровня GPT-4, маркет-мейкер Qwen-Long, была снижена с 0,02 юаня за 1000 токенов до 0,5 юаня за 1 миллион токенов, снижение составило 97%.

9 мая, Tongyi выпустил открытый исходный код модели Qwen1.5-110B с 110 миллиардов параметров. Эта модель превзошла аналоги с 70 миллиардов параметров в нескольких бенчмарках и заняла первое место в рейтинге открытых больших моделей.

Комбинированная стратегия “Снижение цен + Открытый исходный код” становится общим мнением среди мировых производителей больших моделей. Это помогает решить две основные проблемы, с которыми сталкиваются разработчики AI-приложений: слишком высокие цены на API моделей и недостаточное качество открытых моделей, тем самым способствуя широкому внедрению AI-приложений.

В последнее время несколько крупных компаний по производству моделей одновременно выпустили недорогие продукты или приняли меры по снижению цен. Например, API модели MoE, открытый некоторой количественной компанией, стоит всего около одной сотой от цены известной модели. Другая AI-компания снизила цену на вызов своей личной модели с 5 юаней до 1 юаня за миллион токенов. Также некоторые компании выпустили новые версии моделей с сопоставимой производительностью, но с ценой вдвое ниже. Кроме того, некоторые компании даже объявили, что их маркет-мейкерские модели полностью бесплатны или навсегда открыты для API. Эта серия мер по снижению цен может быть связана с прогрессом в технологиях вывода больших моделей и снижением затрат, что объективно предоставляет разработчикам больше выборов и способствует развитию AI-приложений.

Помимо снижения цен, Tongyi также выпустила восемь крупных языковых моделей с параметрами от 500 миллионов до 110 миллиардов, а также мультимодальные модели для визуальных, аудио и кодовых задач. Модели меньшего размера подходят для развертывания на мобильных телефонах, ПК и других конечных устройствах, модели большего размера могут поддерживать корпоративные и научные приложения, а модели среднего размера обеспечивают баланс между производительностью и эффективностью. Эта матрица продуктов с множеством размеров и мультимодальностей помогает удовлетворить потребности различных сценариев применения.

Общее снижение цен на API больших моделей отражает усиливающуюся конкуренцию в отрасли и снижение затрат, вызванное технологическими достижениями. Это предоставит разработчикам AI-приложений больше возможностей и, вероятно, ускорит развитие и внедрение AI-приложений. В то же время применение больших моделей на стороне клиента также заслуживает внимания. В будущем, с продолжением эволюции технологий больших моделей и продвижением процесса коммерциализации, AI-приложения, вероятно, расцветут в более широких областях.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить