Телефоны

Учёные нашли способ удвоить скорость вычислений компьютеров без замены железа

24 февраля

На 56-м ежегодном Международном симпозиуме IEEE/ACM по микроархитектуре исследователи из Калифорнийского университета в Риверсайде (UCR) продемонстрировали подход, при котором любые вычислительные компоненты платформы по-настоящему будут работать одновременно. За счёт этого можно в два раза увеличить скорость вычислений и в два раза сократить потребление энергии. Технология может работать на любых процессорах и ускорителях от смартфонов до серверов ЦОД, но требует доработки.

Источник изображения: ИИ-генерация DALL-E/newatlas.com

«Вам не нужно [для ускорения вычислений] добавлять новые процессоры, потому что они у вас уже есть», — сказал Хунг-Вей Ценг (Hung-Wei Tseng), адъюнкт-профессор факультета электротехники и вычислительной техники Калифорнийского университета и соавтор исследования. Необходимо лишь грамотно распорядиться имеющимися аппаратными ресурсами, а не выстраивать их все в очередь.

Разработанная исследователями платформа, которую они назвали одновременной и гетерогенной многопоточностью (SHMT), отходит от традиционных моделей программирования. Вместо того чтобы предоставлять за один промежуток времени данные лишь одному из вычислительных компонентов системы — центральному, графическому, тензорному или другому процессору или ускорителю, технология SHMT распараллеливает исполнение кода сразу по всем компонентам одновременно.

Тестовая платформа. Источник изображения: Hsu and Tseng

SHMT использует политику планирования многопоточности с учетом такого параметра, как quality-aware work-stealing (QAWS), которая не требует больших затрат ресурсов, но зато помогает поддерживать контроль качества и баланс рабочей нагрузки. Система исполнения создаёт и делит набор виртуальных операций (vOPS) на одну или несколько высокоуровневых операций (HLOPs) для одновременного использования нескольких аппаратных ресурсов. Затем система исполнения SHMT распределяет эти HLOPS по очередям задач для запуска на целевом оборудовании. Поскольку HLOPS не зависят от оборудования, система исполнения может перенаправлять задачи по мере необходимости на тот или иной компонент вычислительной платформы.

Сравнение методов распараллеливания обычного, современного гетерогенного и SHMT

Что особенно ценно, исследователи на примере созданной ими тестовой платформы показали эффективность работы новых программных библиотек. Они создали некий гибрид, который можно считать как смартфоном, так и подобием ПК и даже сервера. На базе объединяющей платы с разъёмом PCIe был создан «компьютер» из комбинации модуля NVIDIA Nano Jetson с четырёхъядерным процессором ARM Cortex-A57 (CPU) и 128 графическими ядрами архитектуры Maxwell (GPU). Через слот M.2 Key E на плате был подключен ускоритель Google Edge (TPU).

Ускорение вычислений SHMT в зависимости от выбранной политики

Основная память представленной системы — это 4 Гбайт LPDDR4 с частотой 1600 МГц и скоростью 25,6 Гбит/с, где хранятся общие данные. Модуль Edge TPU дополнительно содержит 8 Мбайт памяти, а в качестве операционной системы использовался Ubuntu Linux 18.04.

Сравнение потребления в активном режиме и при простое при обычных вычислениях и с использованием SHMT

Запуск на импровизированной гетерогенной платформе пакета SHMT с использованием стандартных приложений для тестирования показал, что при наиболее эффективной политике фреймворк QAWS показывает увеличение скорости вычислений в 1,95 раза и значительное сокращение потребления — на 51 % по сравнению с базовым методом распределения вычислений. Если масштабировать этот подход для использования в составе ЦОД, то выигрыш обещает оказаться колоссальным и при этом всё «железо» останется прежним — менять ничего не придётся. Предложенное решение пока не готово к внедрению, но наверняка без труда найдёт заинтересованных в этом лиц.

Источник: 3Dnews.ru

Электронная книга в формате смартфона и с цветным экраном E Ink….

«Новый DeepSeek-момент»: первый в мире полностью агентный смартфон показали в деле

Ноутбук на замену настольному ПК. Tuxedo Gemini 17 предлагает Core i9-14900HX…

Значимые решения, никакого руководства и пять концовок: в Steam вышло новое…

Значимые решения, никакого руководства и пять концовок: в Steam вышло новое…

Анонсирован триллер-головоломка Rivage, авторы которого хотят повторить успех культовой Blue Prince

«Невероятно атмосферное приключение»: хоррор-долгострой Routine стартовал в Steam с рейтингом 90…

«The Last Night, которую мы не получили»: новый трейлер ретрофутуристического боевика…

Слухи: разработчики Deus Ex провели новую волну сокращений и отменили возрождение…

Ryzen 7 9850X3D — новый лидер на рынке игровых процессоров? Новинка…

Скандал вокруг новенькой GeForce RTX 5080: пользователь пожаловался на сломанный фиксатор…

Сколько осталось до появления полноценных современных чипов Made in USA? TSMC…

Может ли это быть началом китайской Nvidia? Производитель GPU Moore Threads…

Монструозные процессоры AMD станут немного лучше. Обновлённая линейка Ryzen AI Max…

Первой цифровой камере Kodak исполнилось 50 лет — она весила 3,6…

Популярная камера для видеографов стала ещё лучше. Представлена Sony A7 V:…

Sony представила свой первый 200-Мп сенсор Lytia-901 для флагманских смартфонов —…

Представлена 35-мм плёночная камера Kodak Snapic A1 в стиле 90-х за…

В Париже открылась фотовыставка «Мир, я и ты» — на ней…

iPhone Air подешевел в России

Android-смартфоны призвали срочно обновить

Пользователей «Госуслуг» начали вынуждать устанавливать мессенджер Max — «из-за растущего числа…

Антирекорд Apple: iPhone Air за десять недель с покупки теряет почти…

Названа главная проблема больших смартфонов

«Хаббл» прислал первое за четыре месяца изображение межзвёздной кометы 3I/ATLAS

Пользователей «Госуслуг» начали вынуждать устанавливать мессенджер Max — «из-за растущего числа…

Сбой Cloudflare снова «положил» половину интернета — техобслуживание пошло не по…

Роскомнадзор признался, что незаметно заблокировал Snapchat в России

У умной туалетной камеры Kohler Dekoda со сквозным шифрованием не оказалось…

Учёные нашли способ удвоить скорость вычислений компьютеров без замены железа

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Ryzen 7 9850X3D — новый лидер на рынке игровых процессоров? Новинка...