Nvidia показала видеокарты Tesla P4 и P40 с 24 гигабайтами памяти



Nvidia показала два графических ускорителя, специально разработанных для решения профессиональных задач (в частности, для обеспечения функционирования систем глубокого обучения). Новые модели карточек получили маркировки P4 и P40. Несмотря на то, что в обе из них установлены чипы поколения Pascal у этих двух продуктов все-таки имеются отличительные особенности, заслуживающие внимания.

Особенности новых карт

nvidia-tesla-2

Компания Nvidia уже достаточно продолжительное время разрабатывает и предлагает вычислительные системы для глубокого обучения. У них есть две категории продуктов этого класса:

  • выполняющие непосредственно само обучение;
  • отвечающие за логические выводы.

P4 и P40 – это карты, которые созданы как раз для выполнения логических выводов.

Характеристики ускорителей

Обычного пользователя ПК соответствующие модели видеокарт могут поразить своими характеристиками (в особенности P40). Но следует понимать, что данные ускорители созданы не для геймеров, а для систем, выполняющих машинное обучение. Стоят они соответствующе.

nvidia-tesla

Начать следует с наименее мощной модели – Tesla P4. На карточку установлен чип GPU GP104, имеющий 2560 вычислительных ядер CUDA. Собственно, ничего особо впечатляющего нет – в GTX 1080 поставлен точно такой же процессор. Объем ОЗУ P4 составляет 8 гигабайт. Общая вычислительная мощность такой системы составляет около 5,5 терафлопс.

Другое дело P40. Он имеет существенно более производительный процессор, который содержит 3840 ядер, мощность каждого из которых составляет 1303-1531 мегагерц. А объем RAM равен 24 гигабайтам, и работает она на частоте 7200 мегагерц. В тестах эта карточка оказывается более чем в два раза мощнее предыдущей – выдает около 12 терафлопс. Что касается потребления, то оно не пугает – всего 250 Ватт в час.

Программное обеспечение

Вместе с самими карточками Nvidia продемонстрировала и программное обеспечение, которое необходимо для раскрытия всего потенциала железа. В частности была показана библиотека под названием TensorRT, которая облегчает процесс развертывания систем глубокого обучения на этих аппаратных системах.

За исключением глубокого обучения Tesla P4 и P40, естественно, могут быть использованы и для решения других задач, например, для работы с видео. Чтобы железо использовалось максимально эффективно Nvidia разработала DeepStream SDK, которая позволяет аппаратной системе декодировать и анализировать 96 потоков в режиме рилтайм. Это ПО будет работать со всеми картами, которые построены на базе процессоров поколения Pascal.

Рейтинг статьи: 5.0. Всего 3 голоса.
Пожалуйста подождите...
comments powered by HyperComments

Советуем почитать: