Китайская фирма DeepSeek недавно поделилась информацией о затратах на обучение своей новой модели R1, которая была представлена в январе 2025 года. Согласно опубликованным данным в журнале Nature, для процесса потребовались 512 графических ускорителей Nvidia H800, а общие расходы составили 294 тысячи долларов, как сообщает Reuters. Это значительно ниже оценок, озвученных представителями американских компаний. Так, Сэм Альтман, генеральный директор OpenAI, упоминал, что обучение их моделей обходится в «значительно более крупные суммы», превышающие 100 миллионов долларов.

DeepSeek представила затраты на обучение своей модели R1
Изображение взято с:

Тем не менее, некоторые эксперты и участники отрасли выражают сомнения по поводу достоверности данных, предоставленных DeepSeek. Они предполагают, что компания может учитывать только заключительный этап обучения, в то время как общая стоимость разработки может быть значительно выше.

Упомянутые чипы H800 были созданы Nvidia с учетом потребностей китайского рынка после того, как США в октябре 2022 года ограничили экспорт более мощных моделей H100 и A100 в Китай. В дополнение к этому, в июне американские власти сообщили Reuters, что DeepSeek удалось получить «значительные объемы» чипов H100, купленных после введения экспортного контроля.

Источник: www.gazeta.ru
Поделитесь: