RRAM против GPU: разворот аппаратной парадигмы или эволюция вычислений?

Анализ прорывной работы Пекинского университета в области аналоговых матричных вычислений.
В октябре 2025 года журнал Nature Electronics опубликовал работу исследователей Пекинского университета, которая может стать поворотной точкой в развитии вычислительных систем для искусственного интеллекта. Команда ученых под руководством профессора Чжун Суня продемонстрировала аналоговый решатель матричных уравнений на основе резистивной памяти произвольного доступа (RRAM), достигающий точности 24 бита — впервые в истории сравнявшись с цифровыми процессорами формата FP32.

ru.freepik.com

Суть технологического прорыва

Центральная проблема аналоговых вычислений — низкая точность из-за шумов и нестабильности физических процессов — считалась непреодолимой. Китайские исследователи решили ее изящным алгоритмическим способом: итерационное уточнение комбинирует быстрое, но грубое аналоговое обращение матриц с высокоточным аналоговым умножением матрицы на вектор. За 3–10 циклов система достигает цифровой точности, сохраняя при этом колоссальное преимущество в скорости и энергоэффективности.

Результаты бенчмаркинга впечатляют: потенциально в 1000 раз выше пропускная способность и в 100 раз лучше энергоэффективность по сравнению с современными GPU при эквивалентной точности. Время решения матричного уравнения 4×4 составляет всего 120 наносекунд — быстрее, чем один такт современного процессора.

«Это замечательный прорыв в аналоговых вычислениях, решающий давнюю проблему точности для матричных уравнений с использованием технологии RRAM. Достижение 24-битной точности на матрице 16×16 и масштабируемость до больших размеров с помощью разбиения на биты открывает новые горизонты для ИИ и телекоммуникаций, где критически важны эффективные высокопроизводительные вычисления».

— Комментарий Дженсена Хуанга, CEO Nvidia

Революция или эволюция?

Станет ли RRAM «убийцей GPU»? Однозначный ответ дать сложно. Для инференса нейросетей — выполнения уже обученных моделей — технология выглядит революционной. Матрично-векторные операции, составляющие 90% вычислений в трансформерах, выполняются буквально за один физический процесс в массиве RRAM. Однако для обучения моделей остаются критические ограничения: медленное перепрограммирование весов, накопление аналоговых ошибок при обратном распространении, масштабирование до размерностей современных LLM (матрицы 10000×50000 и более).

Более вероятен сценарий гибридной эволюции: RRAM-блоки интегрируются в существующие архитектуры как специализированные ускорители матричных операций. Nvidia, Intel и Samsung уже инвестируют в подобные разработки. Показательно, что работа выполнена на стандартной 40-нм CMOS-линии — технология готова к промышленному масштабированию и это сильный сигнал для отрасли микроэлектроники.

RRAM как ключевой компонент инфраструктуры 6G

Особую практическую значимость работа приобретает в контексте развития сетей шестого поколения. Массивный MIMO — технология с сотнями антенн на базовой станции — является фундаментом 6G, но создает колоссальную вычислительную нагрузку: детектирование сигнала требует обращения матрицы канала в реальном времени для каждого временного слота. Современные цифровые процессоры справляются с этой задачей ценой огромного энергопотребления — до 30% энергозатрат базовой станции уходит на вычисления.
Китайские исследователи продемонстрировали, что RRAM-решатель обеспечивает детектирование сигнала в системе 128×8 MIMO с модуляцией 256-QAM всего за три итерации, достигая идентичной с цифровыми процессорами частоты битовых ошибок (BER). При этом время решения составляет сотни наносекунд против микросекунд у GPU, а энергопотребление снижается на два порядка. Для операторов связи это означает радикальное сокращение операционных расходов и углеродного следа при одновременном увеличении пропускной способности сети. Учитывая, что коммерческое развёртывание 6G ожидается к 2030 году, RRAM-ускорители имеют реальные шансы стать стандартным компонентом телекоммуникационной инфраструктуры нового поколения.

Окно возможностей для России

Может ли Россия использовать парадигмальный сдвиг в вычислениях для обеспечения технологического лидерства, сфокусировавшись на производстве мемристоров? Теоретически — да. RRAM-технология не требует передового литографического оборудования: китайская работа выполнена на 40-нм процессе, доступном отечественным производителям. Ключевые компетенции — материаловедение оксидов переходных металлов и схемотехника аналоговых вычислений — исторически сильны в российской научной школе.
Практические шаги могут включать: создание консорциума ведущих университетов и научных центров (НИУ ВШЭ, ННГУ, ВНИИЭФ, НИЦ «Курчатовский институт», ИФП им. А. В. Ржанова СО РАН) с «Микроном» для разработки отечественных RRAM-ускорителей; целевое финансирование прикладных исследований в области нейроморфных вычислений; интеграцию с программой развития ИИ для создания энергоэффективных edge-устройств. Успех китайских коллег демонстрирует: технологический прорыв возможен при концентрации ресурсов на перспективном направлении, даже без доступа к самым передовым литографическим процессам.
Работа Пекинского университета — не просто научная публикация, а демонстрация работающего прототипа с измеримыми преимуществами над цифровыми системами. До полноценной конкуренции с H100 от Nvidia в обучении GPT- масштабных моделей еще 5–10 лет, но для энергоэффективного инференса на периферийных устройствах и обработки сигналов в телекоммуникациях технология готова уже сейчас.
Вопрос не в том, заменит ли RRAM GPU, а в том, как быстро гибридные архитектуры станут новым стандартом — и кто окажется готов к этому переходу в мировой гонке искусственного интеллекта.

В.В. Вишнякова

Директор ЦТУ СЭИ НИУ ВШЭ

Ноябрь 2025

Оригинальная статья: Zuo, P., Wang, Q. et al. Precise and scalable analogue matrix equation solving using resistive random-access memory chips. Nature Electronics (2025). https://doi.org/10.1038/s41928-025-01477-0