DeepSeek, стартап по искусственному интеллекту с базой в Ханчжоу, Китай, привлек значительное внимание в мировой индустрии искусственного интеллекта с выпуском крупной языковой модели DeepSeek-V3 в конце декабря 2024 года. Эта модель имеет 671 миллиард параметров, но ее обучение заняло всего около двух месяцев и стоило 5,58 миллиона долларов США, значительно меньше, чем у других крупных технологических компаний. DeepSeek-V3 достигает лучших показателей среди открытых моделей и сравнивается с самыми передовыми моделями в мире. Компания оптимизировала процесс обучения для минимизации затрат, используя около 2,78 миллиона часов GPU с графическими процессорами H800 от Nvidia, произведенными в Китае. Это демонстрирует, что китайские AI-компании добились значительного прогресса, несмотря на ограничения со стороны США в доступе к передовым полупроводникам, необходимым для обучения AI. Успех DeepSeek вызвал беспокойство в американской технологической индустрии, акции Nvidia и других технологических компаний рухнули. Эксперты считают, что DeepSeek достиг высокой производительности по гораздо более низкой стоимости по сравнению с американскими аналогами благодаря использованию открытых технологий и эффективных методов обучения. Кроме того, DeepSeek выпустила исходный код и подробные технические объяснения модели, позволяя исследователям и разработчикам всего мира получить доступ и улучшить эту технологию. Эта прозрачность контрастирует с более скрытным подходом ведущих американских компаний по искусственному интеллекту и может изменить способ разработки моделей крупными технологическими компаниями в будущем.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
#Deepseek Goes Viral#
DeepSeek, стартап по искусственному интеллекту с базой в Ханчжоу, Китай, привлек значительное внимание в мировой индустрии искусственного интеллекта с выпуском крупной языковой модели DeepSeek-V3 в конце декабря 2024 года. Эта модель имеет 671 миллиард параметров, но ее обучение заняло всего около двух месяцев и стоило 5,58 миллиона долларов США, значительно меньше, чем у других крупных технологических компаний.
DeepSeek-V3 достигает лучших показателей среди открытых моделей и сравнивается с самыми передовыми моделями в мире. Компания оптимизировала процесс обучения для минимизации затрат, используя около 2,78 миллиона часов GPU с графическими процессорами H800 от Nvidia, произведенными в Китае. Это демонстрирует, что китайские AI-компании добились значительного прогресса, несмотря на ограничения со стороны США в доступе к передовым полупроводникам, необходимым для обучения AI.
Успех DeepSeek вызвал беспокойство в американской технологической индустрии, акции Nvidia и других технологических компаний рухнули. Эксперты считают, что DeepSeek достиг высокой производительности по гораздо более низкой стоимости по сравнению с американскими аналогами благодаря использованию открытых технологий и эффективных методов обучения.
Кроме того, DeepSeek выпустила исходный код и подробные технические объяснения модели, позволяя исследователям и разработчикам всего мира получить доступ и улучшить эту технологию. Эта прозрачность контрастирует с более скрытным подходом ведущих американских компаний по искусственному интеллекту и может изменить способ разработки моделей крупными технологическими компаниями в будущем.