...

Руководство по выбору правильного графического процессора

Общие сведения

Современный компьютер невозможно представить без видеокарты, производительность которой определяется характером использования системы. Попробуем объединить информацию о видеокартах и научиться выбирать оптимальный вариант. Первое, что необходимо знать: производительность видеокарты в первую очередь зависит от графического процессора. Условно их можно разделить на три категории, что мы постарались отразить в приведенной ниже таблице.

Зеленым цветом отмечены графические процессоры, оптимальные для использования в офисных решениях, оранжевым – в оптимальных системах для работы и дома, красным – в высокопроизводительных решениях для игр и обработки графики.

Графические процессоры NVIDIA

Графические чипы AMD

Графические чипы указаны в порядке возрастания производительности, т.е. чем ниже расположено название чипа в столбце, тем он быстрее. Для сравнения производительности чипов, независимо от их изготовителя, на нашем сайте есть теоретический рейтинг.

Вторым важным параметром является тип видеопамяти, который оказывает значительное влияние на производительность. Краткое представление типов памяти – от самой медленной до самой быстрой – выглядит так:

GDDR2 (DDR2) => DDR3 => GDDR3 => GDDR4 => GDDR5

Подробнее о типах видеопамяти здесь.

  • 512Mb DDR-5 ASUS EAH5670 /DI/512MD5/V2 (RTL) +DVI+HDMI
  • 1Gb DDR-3 ASUS EAH5670 /DI/1GD3 (RTL) +DVI+HDMI

Видеокарты для офисного компьютера

  • 512Mb DDR-3 ASUS ENGT240 /DI/512MD3/V2 (RTL) +DVI+HDMI
  • 1Gb DDR-3 ASUS ENGT520 DI/1GD3/LP (RTL) +DVI+HDMI
  • 1Gb DDR-3 ASUS ENGT440 DI/1GD3 (RTL) +DVI+HDMI
  • 1Gb DDR-3 ASUS ENGT520 SILENT/DI/1GD3/LP (RTL) +DVI+HDMI
  • 1Gb DDR-3 ASUS ENGT440 DC SL/DI/1GD3 (RTL) +DVI+HDMI
  • 1Gb DDR-3 ASUS ENGT430 DC SL/DI/1GD3(EU) (RTL) +DVI+HDMI
  • 1Gb DDR-2 ASUS EAH5570 SILENT/DI/1GD2 (RTL) +DVI+HDMI
  • 1Gb DDR-3 ASUS EAH5450 SILENT DS/1GD3/LP (RTL) +DVI+DP

Видеокарты для универсального компьютера

  • 1Gb DDR-5 ASUS EAH6770 DC/2DI/1GD5 (RTL) +DVI+HDMI
  • 1Gb DDR-5 ASUS EAH6850 DC/2DIS/1GD5/V2 (RTL) DualDVI+HDMI+DP
  • 1Gb DDR-3 ASUS ENGTS450 DI/1GD3 (RTL) +DVI+HDMI+SLI
  • 1Gb DDR-5 ASUS ENGTX560 DC/2DI/1GD5 (RTL) DualDVI+miniHDMI+SLI

или на базе чипа AMD Radeon серии HD67xx:

Последнее решение представляет наибольший интерес, т.к это самый производительный вариант видеокарты с пассивным охлаждением. Появление такого графического адаптера было бы невозможно без уникальной системы охлаждения DirectCu Silent с технологией прямого контакта тепловых трубок с поверхностью графического процессора. Такой инновационный подход даёт преимущество в охлаждении до 20%.
Более производительные модели используют активное охлаждение, но за счёт применения вентиляторов с автоматической регулировкой скорости вращения шум от таких видеокарт будет заметен только под серьезной нагрузкой. Кроме того, в большей части видеокарт данной группы компания ASUS использует системы охлаждения с прямым контактом DirectCu, описанные выше, благодаря которым тепло будет быстрее передаваться на радиатор и, соответственно, быстрее рассеиваться в окружающую среду. В результате вентилятор будет крутиться медленнее, избавляя пользователя от лишнего шума.

Кстати о вентиляторах. Компания ASUS продумала даже этот важный элемент систем охлаждения, дальнейшая модернизация которого, казалось бы, не представляется возможной. В своих вентиляторах ASUS применяет технологию Dust-Proof Fun, защищающую внутренние элементы вентилятора от пыли, значительно продлевая срок эксплуатации.
Из-за достаточно большой массы таких видеокарты в плате данного класса реализована технология GPU Guard, защищающая графический чип от повреждений, связанных с деформацией карты. Как и все гениальные решения, данная технология является довольно простой и заключается в дополнительном укреплении печатной платы в месте расположения графического процессора.

Игровые видеокарты

Самые дорогие и вместе с тем производительные карты созданы для игровых компьютеров. В них реализованы все новейшие разработки, с помощью которых профессиональные игроки будут доминировать на полях виртуальных сражений. Среди решений этого класса стоит выделить линейку ROG (Republic of Gamers). Графические карты этой серии являются, пожалуй, лучшими игровыми видеокартами из всех, представленных на рынке. Типичным примером такой видеокарты является ASUS MATRIX GTX580 P/2DIS/1536MD5. Как и все видеокарты ASUS, MATRIX создаётся на базе качественных компонентов с применением различных технологий, позволяющих не только насладиться качественной графикой абсолютно во всех современных играх, но повысить производительность видеокарты путем разгона. Для этого в комплекте с картой поставляется программное обеспечение GPU Tweak, позволяющее изменять огромное число параметров, таких как частота чипа и памяти, а также напряжение на графическом чипе; дополнительно предусмотрена возможность управления скоростью вращения вентиляторов. В числе полезных функций данной утилиты также можно выделить возможность обновления драйверов и BIOS видеокарты и мониторинга состояния видеокарты. Самая интересная «фича» – возможность сохранения удачных параметров разгона в BIOS платы, что будет особенно удобно тем, кто часто переустанавливает операционную систему либо в случае, когда на компьютере одновременно установлено несколько ОС. Стоит отметить, что GPU Tweak работает не только с серией Matrix, но и со всеми видеокартами ASUS. На пластиковом кожухе системы охлаждения имеется цветовая индикация загрузки графического чипа, так что владелец такой карты в режиме реального времени сможет наблюдать за её поведением в различных приложениях.
Непосредственно на самой карте есть три кнопки TweakIt, с помощью которых можно увеличивать напряжение на графическом чипе для повышения стабильности работы, а также кнопка отключения/включения автоматического управления вентиляторами, заставляющая их вращаться с максимальной скоростью.
Энтузиастов заинтересует наличие шести контактных площадок для измерения напряжения на плате с помощью мультиметра (ProbeIt).

В случае неудачного эксперимента настройки видеокарты можно вернуть к значениям по умолчанию с помощью кнопки Safe Mode, расположенной на панели видео-выходов.

Еще одним интересным представителем семейства видеокарт ASUS является модель ASUS MARS II /2DIS/3GD5 – самая быстрая в мире игровая видеокарта на сегодняшний день. Эта модель построена на базе двух полноценных чипов NVIDIA GTX 580 – результат, которого не смог добиться ни один другой производитель.

Помимо линейки ROG, компания ASUS предлагает более скромные, но не менее качественные решения старшего сегмента, собранные в референсном дизайне. Примером такого графического адаптера может служить прекрасная модель 2Gb

DDR-5 ASUS EAH6970 /2DI2S/2GD5 (RTL) DVI+HDMI+DualminiDP . Дизайн её печатной платы и система охлаждения разработаны компанией-производителем графического чипа, в данном случае AMD.

Помимо подобных решений, ASUS разрабатывает свои собственные видеокарты, такие как 2Gb

DDR-5 ASUS EAH6970 DCII/2DI4S/2GD5 (RTL) DualDVI+4xDP На данной плате реализована фирменная система охлаждения ASUS DirectCU II с технологией прямого контакта и двумя пылезащищенными вентиляторами. Такая система охлаждения обеспечивает в 6 раз более эффективный воздушный поток и на 20% более низкую температуру графического чипа.
В заключение хотелось бы отметить, что при производстве видеокарт ASUS применяются только самые качественные компоненты, обеспечивающие прекрасную стабильность работы и высокую надежность. Вся продукция проходит выходной контроль качества, поэтому на данный момент видеокарты ASUS являются одними из лучших решений в своем классе. Именно этим объясняется их неизменная популярность.

Чем отличаются графические процессоры для настольных ПК и ноутбуков?

Выбор между игровым ПК и игровым ноутбуком обычно сводится к анализу производительности, а зависит она во многом от дискретного видеоадаптера. Особенно сложно разобраться, если в обоих устройствах стоит графический адаптер с одним и тем же названием.

Например, RTX 3080 Ti встречается и в лэптопах игрового класса, и в десктопных компьютерах. Однако ошибкой будет полагать, что графическая производительность у обоих устройств одинаковая. Чаще всего ноутбук запускает игры (да и в целом работает) медленнее по сравнению с ПК на таком же дискретном видеоадаптере, хотя стоит он при этом дороже.

Почему так? Дело не том, что ограниченное пространство в корпусе ноутбука не позволяет реализовать эффективную систему охлаждения, как в ПК. Да, причина может быть и такой, но она далеко не на первом месте.

Разработчикам приходится идти на разные ухищрения, чтобы производительность игровых ноутбуков не слишком отличалась от ПК. Вот почему GPU для настольных компьютеров и GPU для ноутбуков – это принципиально разные вещи.

Как работает графический процессор для настольного компьютера?

Дискретный графический процессор – это то, что в быту обычно называют видеокартой. Это печатная плата с блоком управления, несколькими портами и шиной PCI Express для подключения к материнской плате компьютера. Для надежной фиксации предусмотрены болты, а для подключения к монитору используется кабель HDMI / DisplayPort. При правильной установке графический процессор выводит на монитор изображение.

По мере того, как графика игр становится сложнее и насыщеннее, растут и возможности графических процессоров. В них появляются мощные разъемы питания (их может быть не один, а сразу два или три в зависимости от энергопотребления видеоадаптера), огромные кулеры и сложные системы охлаждения.

Настольным графическим процессорам характерно высокое энергопотребление. Как следствие, они сильно греются, но обычно в корпусе компьютера достаточно пространства для хорошей циркуляции воздуха, за счет которой рассеиваются излишки тепла.

Как работает графический процессор для ноутбука?

Полноценная десктопная видеокарта в ноутбук не поместится из-за своей габаритности. Правда, исключения существуют, но им сопутствует множество не самых приятных компромиссов. Большинство графических процессоров для ноутбуков являются урезанной версией настольных GPU. Они обязаны соответствовать ряду требований: быть достаточно маленькими, достаточно мощными для запуска современных видеоигр и при этом достаточно энергоэффективными, чтобы ноутбук не превратился в печку с экраном и взрывоопасным аккумулятором.

GPU для ноутбуков принципиально отличаются от своих настольных аналогов, даже если по наименованию относятся к одной серии.

Основное отличие касается энергоэффективности. Для снижения энергопотребления в ход идут любые средства вплоть до того, что при определенных задачах ноутбук переключается на интегрированный видеочип.

Видеоадаптеры для ПК и ноутбуков: в чем разница?

Как уже говорилось, приоритетом для ноутбучных GPU является максимально низкое энергопотребление при высоких возможностях отрисовки. Хотя производители портативных компьютеров и SoC принимают разные меры, чтобы достичь желаемого эффекта, чаще всего снижение энергопотребления достигается самым простым и грубым способом – ослаблением самого чипа.

Почему для ПК и ноутбуков существуют разные линейки видеокарт? Да потому что нельзя просто вытащить из компьютера Nvidia RTX 3090 Ti и поставить в ноутбук, чтобы со спокойной душой играть. Опустим конструктивные различия между ПК и лэптопом, просто представим, что каким-то чудом видеокарта поместилась внутри ноутбука. Что будет дальше? Уже через пару дней лэптоп начнет в прямом смысле плавиться.

GPU для настольных ПК и ноутбуков – это далекие друг от друга продукты. К сожалению, многие пользователи даже не подозревают об этом.

Вот к примеру, RTX 3080 Ti. Настольная версия этой видеокарты – настоящий зверь, способный переварить самые сложные 4К-игры на максималках. А вот ноутбучная версия по производительности где-то на уровне десктопной RTX 3070. Она мощна, это факт, но лэптоп на ее основе не вытянет те настройки графики, с которыми справится ПК на полноценной RTX 3080 Ti. А самая обида в том, что ноутбук с урезанной RTX 3080 Ti может стоить столько же или даже дороже, чем системный блок с полноценной RTX 3080 Ti.

Разница в цене – это плата за мобильность, возможность взять ноутбук под мышку и сменить локацию. Пока нет способов эффективно охлаждать портативную игровую систему, поэтому приходится жертвовать ее производительностью.

Можно ли подключить десктопный видеоадаптер к ноутбуку?

Да, это возможно. Причем решение весьма элегантное и аккуратное (насколько это вообще возможно).

Если в ноутбуке есть порт Thunderbolt 3 с поддержкой внешней видеокарты, решением может стать Razer Core X. Это бокс для установки видеокарты десктопного типа со всеми необходимыми интерфейсами и креплениями. К ноутбуку будет проложен кабель Thunderbolt, и если подключение сделано верно, карта опознается ноутбуком и на ней можно будет играть.

Удобство такого решения очень сомнительное, ведь ноутбук полностью потеряет свойственную ему от природы портативность. Прибегнуть к нему оправданно только в двух случаях:

  • девайс совсем стар и слаб;
  • это очень тонкий и легкий ультрабук без дискретного видеочипа.

Помимо Razer Core X есть варианты от других брендов (некоторые даже продаются в комплекте с видеокартой), но суть у них одна.

Графические адаптеры для ноутбуков слабее десктопных, но на это есть веские причины

Очень бы хотелось видеть на ноутбуке графическую мощность, аналогичную ПК с RTX 3080 или даже 3090, но увы. Ограничения по теплоотводу не позволяют разгонять кремний до той же степени: для ноутбука это чревато фатальными повреждениями.

Но вообще можно найти ноутбуки с производительностью уровня игровых ПК, что, конечно же, радует. Не радуют только их цены.

Как выбрать графический процессор для глубокого обучения

hardware gpu machine learning

Глубокое обучение требует больших вычислительных ресурсов, поэтому очень важно, какой графический процессор (видеокарту) вы выберете для своих исследований. Надежный GPU позволит быстро вычислять оптимальные архитектуры и настройки глубоких сетей, и проводить эксперименты за дни вместо месяцев, часы вместо дней, минуты вместо часов.

Перевод статей A Full Hardware Guide to Deep Learning и Which GPU(s) to Get for Deep Learning, автор — Tim Dettmers. Ссылка на оригинал — в подвале статьи.

О том, как найти компромисс между стоимостью и производительностью в облачных GPU читайте здесь: Сравнение Cloud GPU для машинного обучения

Выбор GPU

Три основные ошибки, которые обычно делаются при выборе видеокарты:

  • высокая цена/низкая производительность;
  • недостаточый объем памяти;
  • плохое охлаждение.

В целом, требования к памяти следующие:

  • Для исследования, в котором нужна максимальная производительность: > = 11 ГБ
  • Для поиска новых архитектур: > = 8 ГБ
  • Любое другое исследование: 8 ГБ
  • Kaggle: 4 — 8 ГБ
  • Стартапы: 8 ГБ (но проверьте конкретную область применения для размеров модели)
  • Компании: 8 ГБ для прототипирования, > = 11 ГБ для обучения

Другая проблема, на которую стоит обратить внимание, особенно если вы покупаете несколько RTX-карт, это охлаждение. Если вы хотите вставить GPU в слоты PCIe, которые расположены рядом друг с другом, вы должны убедиться, что получаете GPU с вентилятором. В противном случае процессоры будут перегреваться, работать медленнее (примерно на 30%) и умирать быстрее.

Стоит ли использовать несколько видеокарт?

Использование нескольких видеокарт позволит увеличить скорость обучения, поэтому имеет смысл, если у вас есть на это деньги.

Для сверточных нейронных сетей можно ожидать ускорения в 1,9x/2,8x/3,5x для 2/3/4 графических процессоров.

Для рекуррентных сетей длина последовательности является наиболее важным параметром, а для распространенных проблем NLP можно ожидать аналогичного или несколько худшего ускорения, чем для сверточных сетей.

Полносвязные сети обычно имеют низкую производительность для параллелизма данных, и для ускорения необходимы более совершенные алгоритмы.

Еще одно преимущество использования нескольких GPU, даже если вы не распараллеливаете алгоритмы, заключается в том, что вы можете запускать несколько экспериментов отдельно на каждом графическом процессоре. Вы не получаете ускорения, но получаете больше информации о производительности, используя различные алгоритмы или параметры одновременно.

Это очень полезно, если ваша главная цель — как можно быстрее получить опыт обучения сети. Это полезно и для исследователей, которые хотят попробовать несколько версий нового алгоритма одновременно.

Что один графический процессор делает быстрее другого?

Лучший показатель производительности графического процессора — комбинация пропускной способности, FLOPS и Tensor Cores.

Чтобы углубить ваше понимание и помочь сделать осознанный выбор, расскажу о том, какие части аппаратного обеспечения ускоряют работу GPU для двух наиболее важных тензорных операций: перемножения матриц и свертки.

Простой и эффективный способ думать о матричном умножении — это то, что оно ограничено пропускной способностью. То есть пропускная способность памяти является наиболее важной особенностью GPU, если вы хотите использовать LSTM и другие рекуррентные сети, которые выполняют многократное умножение матриц.

Для сверточных нейронных сетей имеет значение скорость обучения. Таким образом, TFLOP на графическом процессоре — лучший показатель производительности ResNet и других сверточных архитектур.

Тензорные сердечники слегка меняют уравнение. Это очень простые специализированные вычислительные блоки, которые могут ускорить вычисления — но не пропускную способность памяти — и, таким образом, наибольшее преимущество можно увидеть для сверточных сетей, которые с тензорными ядрами быстрее примерно на 30-100% .

В целом, правило выбора GPU для машинного обучения следующее:

GPU для машинного обучения - советы и рекомендации

  • с мотрите на показатели пропускной способности, если вы работаете с RNN;
  • смотрите на показатели FLOPS, если вы работаете со сверткой;
  • используйте тензорные ядра, если можете себе позволить.

Производительность/стоимость

Экономическая эффективность графического процессора, вероятно, наиболее важный критерий выбора. Я провел анализ эффективности затрат, который включал пропускную способность памяти, TFLOP и Tensor Cores. Я посмотрел цены на eBay и Amazon и взвесил их 50:50, а затем посмотрел на показатели эффективности для LSTM, CNN с и без тензорных ядер. Я взял эти показатели производительности и усреднил их, чтобы получить средние оценки производительности, с помощью которых я затем рассчитал показатели производительности/стоимости. Вот результат:

рекомендации по выбору GPU для глубокого обучения

Из этих данных видно, что RTX 2070 является более экономичным, чем RTX 2080 или RTX 2080 Ti. Почему это так? Способность выполнять 16-битные вычисления с Tensor Cores намного более ценна, чем просто наличие большого количества тензорных ядер. С RTX 2070 вы получаете эти функции по самой оптимальной цене.

Этот анализ также имеет определенные отклонения, которые следует учитывать:

  1. Цены колеблются. В настоящее время цены карты GTX 1080 Ti, RTX 2080 и RTX 2080 Ti кажутся завышенными, но в будущем они могут стать более разумными.
  2. Анализ не учитывает, сколько памяти вам нужно и сколько GPU вы можете разместить на своем компьютере. Один компьютер с 4 быстрыми GPU намного экономичнее двух компьютеров с самыми оптимальными картами.

Заключение

Я вижу две основные стратегии, которые имеют смысл: выбрать графический процессор серии RTX 20, чтобы получить быстрое обновление, или выбрать дешевый графический процессор серии GTX 10 и обновить его, как только RTX Titan станет доступен.

Если вы менее серьезно относитесь к производительности или она просто не нужна вам, например, в случае с Kaggle и прототипированием, вы можете значительно выиграть от дешевых графических процессоров серии GTX 10. При этом, если вы выбираете графический процессор серии GTX 10, будьте осторожны, чтобы объем памяти графического процессора соответствовал вашим требованиям.

Общие рекомендации по выбору GPU

Лучший GPU в целом: RTX 2070.

Следует избегать : любая карта Tesla; любая карта Quadro; любая карта Founders Edition; Titan V, Titan XP.

Рентабельно, но дорого: RTX 2070.

Рентабельно и дешево: GTX Titan (Pascal) с eBay, GTX 1060 (6GB), GTX 1050 Ti (4GB).

У меня мало денег: GTX Titan (Pascal) с eBay, или GTX 1060 (6 ГБ), или GTX 1050 Ti (4 ГБ).

У меня почти нет денег: GTX 1050 Ti (4 ГБ); CPU (прототипирование) + AWS / TPU (обучение); или Colab.

Я участвую в Kaggle: RTX 2070. Если вам не хватает денег, выберите GTX 1060 (6 ГБ) или GTX Titan (Pascal) c eBay для создания прототипов и AWS для окончательного обучения. Используйте библиотеку fastai.

Я работаю с технологиями компьютерного зрения или машинного перевода: GTX 2080 Ti с конструкцией вентилятора; Обновление до RTX Titan в 2019 году.

Я — исследователь NLP: RTX 2070.

Я начал углубленное изучение глубокого обучения и я серьезно к этому отношусь: начните с RTX 2070. В зависимости от того, какую область вы выберете дальше (стартап, Kaggle, исследования, прикладное глубокое обучение), продадите свой графический процессор и купите что-нибудь более подходящее примерно через два года.

Я хочу попробовать глубокое обучение, но я не серьезно: GTX 1050 Ti (4GB) или 1050 (2GB).

При подготовке материала использовались источники:
https://www.nix.ru/computer_hardware_news/hardware_news_viewer.html?id=170350
https://setphone.ru/stati/chem-otlichayutsya-graficheskie-protsessory-dlya-nastolnyh-pk-i-noutbukov/

Как выбрать графический процессор для глубокого обучения

Оцените статью