Китайский ИИ-стартап DeepSeek обновил свою флагманскую ИИ-модель V3 и удалил упоминание рассуждающей нейросети R1 в чат-боте. Об этом пишет SCMP.
Компания объявила о выпуске V3.1 в WeChat. Обновление расширяет контекстное окно модели до 128 000 токенов, позволяя ей хранить больше информации при взаимодействии с пользователем. Такой объем соответствует книге примерно на 300 страниц.
Также отмечается высокая эффективность использования токенов.
Данные: X.В бенчмарке Aider Polyglot, оценивающем LLM в решении сложных задач программирования сразу на нескольких языках, DeepSeek V3.1 превосходит Claude 4 Opus.
DeepSeek V3.1 beats Claude 4 Opus on Aider Polyglot
This makes it the best non-TTC coding model and all of that for ~$1 pic.twitter.com/QyJZnVRdVK
— Lisan al Gaib (@scaling01) August 19, 2025
V3.1 сохраняет баланс между скоростью и качеством генерации. Она содержит 685 миллиардов параметров и базируется на гибридной архитектуре, обеспечивающей высокую производительность в задачах диалога, рассуждения и программирования.
DeepSeek удалила упоминание R1 из функции глубокого мышления. В SCMP предположили, что это может указывать на трудности при разработке ожидаемой версии R2.
ИИ-стартап DeepSeek привлек внимание в январе выпуском модели R1, ориентированной на рассуждения. Она продемонстрировала высокую эффективность при низких капиталовложениях, из-за чего среди экспертов возникли сомнения касательно необходимости миллиардных вливаний в ИИ-сектор и раздутости индустрии.
Напомним, в июне китайский стартап начал найм стажеров для маркировки медицинских данных с целью улучшить применение искусственного интеллекта в больницах.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
DeepSeek выпустил новую ИИ-модель V3.1
Китайский ИИ-стартап DeepSeek обновил свою флагманскую ИИ-модель V3 и удалил упоминание рассуждающей нейросети R1 в чат-боте. Об этом пишет SCMP.
Компания объявила о выпуске V3.1 в WeChat. Обновление расширяет контекстное окно модели до 128 000 токенов, позволяя ей хранить больше информации при взаимодействии с пользователем. Такой объем соответствует книге примерно на 300 страниц.
Также отмечается высокая эффективность использования токенов.
V3.1 сохраняет баланс между скоростью и качеством генерации. Она содержит 685 миллиардов параметров и базируется на гибридной архитектуре, обеспечивающей высокую производительность в задачах диалога, рассуждения и программирования.
DeepSeek удалила упоминание R1 из функции глубокого мышления. В SCMP предположили, что это может указывать на трудности при разработке ожидаемой версии R2.
ИИ-стартап DeepSeek привлек внимание в январе выпуском модели R1, ориентированной на рассуждения. Она продемонстрировала высокую эффективность при низких капиталовложениях, из-за чего среди экспертов возникли сомнения касательно необходимости миллиардных вливаний в ИИ-сектор и раздутости индустрии.
Напомним, в июне китайский стартап начал найм стажеров для маркировки медицинских данных с целью улучшить применение искусственного интеллекта в больницах.