Параллельная ЭВМ — различия между версиями
м |
(стилистические правки) |
||
(не показана одна промежуточная версия этого же участника) | |||
Строка 1: | Строка 1: | ||
− | '''Параллельная вычислительная машина (система)''' <u>нестрого</u> определяется как система, в которой <u> | + | '''Параллельная вычислительная машина (система)''' <u>нестрого</u> определяется как система, в которой <u>множественные</u> вычисляющие узлы <u>работают совместно</u> над выполнением одной или многих задач – осуществляют [[параллельные вычисления]]. Эта модель отличается от [[машина фон Неймана|фон-неймановской модели]] последовательной ЭВМ, в которой выполнение команд происходит лишь на одном вычисляющем-исполняющем узле (процессоре). |
− | + | [[архитектура параллельных ЭВМ|Архитектура]] этого класса ЭВМ включает два основных варианта конструктивного исполнения: [[вычислительный кластер|кластеры]] и [[MPP|массово-параллельные системы]]. Также конструктивное исполнение различается по <u>непосредственно</u> поддерживаемой в нём модели параллельных вычислений — [[параллельные вычисления с общей памятью|с общей памятью]], [[параллельные вычисления с передачей сообщений|с передачей сообщений]] или смешанной. Кроме того, по способу программной организации параллельной обработки выделяют [[классификация Флинна|классы Флинна]]. | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
== Производительность == | == Производительность == | ||
Некоторые наиболее часто употребляемые характеристики параллельных ЭВМ: | Некоторые наиболее часто употребляемые характеристики параллельных ЭВМ: | ||
− | '''Пиковая (теоретическая, номинальная) производительность''', R<sub>peak</sub> – величина, получаемая простым умножением количества вычисляющих устройств (процессоров, ядер и т.д.) в системе на максимальное возможное число арифметических операций (флоп; Flop – ''floating point operation'') с плавающей запятой, производимых вычисляющим устройством за один такт сигнала синхронизации<!--и попробуй запросто найти этот параметр!-->, на число тактов в секунду. | + | '''Пиковая (теоретическая, номинальная) производительность''', '''R<sub>peak</sub>''' – величина, получаемая простым умножением количества вычисляющих устройств (процессоров, ядер и т.д.) в системе на максимальное возможное число арифметических операций (флоп; Flop – ''floating point operation'') с плавающей запятой, производимых вычисляющим устройством за один такт сигнала синхронизации<!--и попробуй запросто найти этот параметр!-->, на число тактов в секунду. |
Например, один процессор Intel Itanium 2, работающий с тактовой частотой 1,5 ГГц, способен производить 4 операции с плавающей запятой за один такт и, следовательно, обладает пиковой производительностью 6 Гфлоп/с; единицу ''флоп/с'' могут употреблять в виде «флопс». | Например, один процессор Intel Itanium 2, работающий с тактовой частотой 1,5 ГГц, способен производить 4 операции с плавающей запятой за один такт и, следовательно, обладает пиковой производительностью 6 Гфлоп/с; единицу ''флоп/с'' могут употреблять в виде «флопс». | ||
− | '''Максимальная производительность''', R<sub>max</sub> – показатель, связанный со временем исполнения образцовой программы («бенчмарк»). В мировом списке мощнейших параллельных систем TOP500 в качестве образцовой программы используется ''HPL benchmark'', основанная на [[LINPACK]]). | + | '''Максимальная производительность''', '''R<sub>max</sub>''' – показатель, связанный со временем исполнения образцовой программы («бенчмарк»). В мировом списке мощнейших параллельных систем TOP500 в качестве образцовой программы используется ''HPL benchmark'', основанная на [[LINPACK]]). |
'''Параметр N<sub>max</sub>''' (сопряжённый с максимальной производительностью): (максимальный) счётный размер (объём) задачи, при котором был получен определённый показатель R<sub>max</sub>. | '''Параметр N<sub>max</sub>''' (сопряжённый с максимальной производительностью): (максимальный) счётный размер (объём) задачи, при котором был получен определённый показатель R<sub>max</sub>. | ||
− | '''Параметр N<sub>half</sub>''' (N<sub>1/2</sub>): счётный размер (объём) задачи, для которой машина показывает половину максимальной производительности. Это хороший показатель качества внутренней сети: чем N<sub>half</sub> меньше, тем лучше (соотношение 1/10 считается хорошим показателем). | + | '''Параметр N<sub>half</sub>''' ('''N<sub>1/2</sub>'''): счётный размер (объём) задачи, для которой машина показывает половину максимальной производительности. Это хороший показатель качества внутренней сети: чем N<sub>half</sub> меньше, тем лучше (соотношение 1/10 считается хорошим показателем). |
+ | |||
+ | == Проблемы построения == | ||
+ | При построении достаточно мощных параллельных ЭВМ особо существенными становятся проблемы энергопитания (энергопотребления); а также встраивания таких вычислительных систем в окружающую их среду (охлаждения и климатизации, шума, электромагнитной совместимости). | ||
— [[user:Yury Tarasievich|Ю.Т.]] | — [[user:Yury Tarasievich|Ю.Т.]] |
Текущая версия на 13:19, 24 февраля 2017
Параллельная вычислительная машина (система) нестрого определяется как система, в которой множественные вычисляющие узлы работают совместно над выполнением одной или многих задач – осуществляют параллельные вычисления. Эта модель отличается от фон-неймановской модели последовательной ЭВМ, в которой выполнение команд происходит лишь на одном вычисляющем-исполняющем узле (процессоре).
Архитектура этого класса ЭВМ включает два основных варианта конструктивного исполнения: кластеры и массово-параллельные системы. Также конструктивное исполнение различается по непосредственно поддерживаемой в нём модели параллельных вычислений — с общей памятью, с передачей сообщений или смешанной. Кроме того, по способу программной организации параллельной обработки выделяют классы Флинна.
Производительность
Некоторые наиболее часто употребляемые характеристики параллельных ЭВМ:
Пиковая (теоретическая, номинальная) производительность, Rpeak – величина, получаемая простым умножением количества вычисляющих устройств (процессоров, ядер и т.д.) в системе на максимальное возможное число арифметических операций (флоп; Flop – floating point operation) с плавающей запятой, производимых вычисляющим устройством за один такт сигнала синхронизации, на число тактов в секунду.
Например, один процессор Intel Itanium 2, работающий с тактовой частотой 1,5 ГГц, способен производить 4 операции с плавающей запятой за один такт и, следовательно, обладает пиковой производительностью 6 Гфлоп/с; единицу флоп/с могут употреблять в виде «флопс».
Максимальная производительность, Rmax – показатель, связанный со временем исполнения образцовой программы («бенчмарк»). В мировом списке мощнейших параллельных систем TOP500 в качестве образцовой программы используется HPL benchmark, основанная на LINPACK).
Параметр Nmax (сопряжённый с максимальной производительностью): (максимальный) счётный размер (объём) задачи, при котором был получен определённый показатель Rmax.
Параметр Nhalf (N1/2): счётный размер (объём) задачи, для которой машина показывает половину максимальной производительности. Это хороший показатель качества внутренней сети: чем Nhalf меньше, тем лучше (соотношение 1/10 считается хорошим показателем).
Проблемы построения
При построении достаточно мощных параллельных ЭВМ особо существенными становятся проблемы энергопитания (энергопотребления); а также встраивания таких вычислительных систем в окружающую их среду (охлаждения и климатизации, шума, электромагнитной совместимости).
— Ю.Т.
Источники
- труды В.В. Воеводина и В.В. Воеводина (мл.).
- TOP500.org — рейтинг и описание 500 самых мощных общественно известных вычислительных систем.