Параллельная ЭВМ — различия между версиями

Материал из ЭНЭ
Перейти к: навигация, поиск
м
Строка 1: Строка 1:
'''Параллельная вычислительная машина (система)''' <u>нестрого</u> определяется как система, в которой <u>множе</u><u>с</u><u>твенные</u> вычисляющие узлы <u>работают совместно</u> над выполнением одной или многих задач – осуществляют [[параллельные вычисления]]. Эта модель отличается от [[машина фон Неймана|фон-неймановской модели]] последовательной ЭВМ, в которой выполнение команд происходит лишь на одном вычисляющем-исполняющем узле (процессоре).
+
'''Параллельная вычислительная машина (система)''' <u>нестрого</u> определяется как система, в которой <u>множественные</u> вычисляющие узлы <u>работают совместно</u> над выполнением одной или многих задач – осуществляют [[параллельные вычисления]]. Эта модель отличается от [[машина фон Неймана|фон-неймановской модели]] последовательной ЭВМ, в которой выполнение команд происходит лишь на одном вычисляющем-исполняющем узле (процессоре).
  
Основные варианты конструктивного исполнения: [[вычислительный кластер|кластеры]] и [[MPP|массово-параллельные системы]]. Также конструктивное исполнение различается по <u>непосредственно</u> поддерживаемой в нём модели параллельных вычислений — [[параллельные вычисления с общей памятью|с общей памятью]], [[параллельные вычисления с передачей сообщений|с передачей сообщений]] или смешанной. Кроме того, по способу программной организации параллельной обработки выделяют [[классификация Флинна|классы Флинна]].
+
[[архитектура параллельных ЭВМ|Архитектура]] этого класса ЭВМ включает два основных варианта конструктивного исполнения: [[вычислительный кластер|кластеры]] и [[MPP|массово-параллельные системы]]. Также конструктивное исполнение различается по <u>непосредственно</u> поддерживаемой в нём модели параллельных вычислений — [[параллельные вычисления с общей памятью|с общей памятью]], [[параллельные вычисления с передачей сообщений|с передачей сообщений]] или смешанной. Кроме того, по способу программной организации параллельной обработки выделяют [[классификация Флинна|классы Флинна]].
  
== Проблемы построения ==
 
=== Внутренняя сеть ===
 
Поскольку вычислительные устройства в составе параллельной ЭВМ (ПарВМ) работают совместно и, следовательно, должны обмениваться данными, важнейшей проблемой при построении ПарВМ является построение сети внутренней сети обмена данными, соединяющей устройства, а это, в свою очередь, означает оптимизацию таких параметров сети, как ''пропускная способность'' (т.наз. «скорость передачи»; ''throughput'', ''bandwidth'') и ''задержка начала поступления данных'' или ''задержка появления данных'' (т.наз. «латентность»; ''latency'') линий связи между вычислительными устройствами – ''внутренней сети''.
 
 
При построении внутренней сети простейшим способом, через локальные сети технологии Ethernet, главной проблемой является большое (до единиц миллисекунд) время задержки появления данных (high latency) у адресата при сравнительно высокой (сотни и тысячи мегабит в секунду) пропускной способности самого канала.
 
 
Данную проблему призваны решать специальные быстродействующие сети с малым временем задержки (SCI, Myrinet, Infiniband и др.). В таких сетях пропускная способность достигает десятков гигабит в секунду при задержке порядка единиц микросекунд. Однако это достигается за счёт усложнения конструкции связных устройств и повышения стоимости оборудования.
 
 
=== Охлаждение и климатизация ===
 
...
 
=== Энергопотребление ===
 
...
 
 
== Производительность ==
 
== Производительность ==
 
Некоторые наиболее часто употребляемые характеристики параллельных ЭВМ:
 
Некоторые наиболее часто употребляемые характеристики параллельных ЭВМ:
Строка 27: Строка 15:
  
 
'''Параметр N<sub>half</sub>''' (N<sub>1/2</sub>): счётный размер (объём) задачи, для которой машина показывает половину максимальной производительности. Это хороший показатель качества внутренней сети: чем N<sub>half</sub> меньше, тем лучше (соотношение 1/10 считается хорошим показателем).
 
'''Параметр N<sub>half</sub>''' (N<sub>1/2</sub>): счётный размер (объём) задачи, для которой машина показывает половину максимальной производительности. Это хороший показатель качества внутренней сети: чем N<sub>half</sub> меньше, тем лучше (соотношение 1/10 считается хорошим показателем).
 +
 +
== Проблемы построения ==
 +
При построении достаточно мощных параллельных ЭВМ особо существенными становятся проблемы энергопитания; а также встраивания таких вычислительных систем в окружающую их среду.
 +
 +
=== Энергопотребление ===
 +
...
 +
=== Охлаждение и климатизация ===
 +
...
 +
=== Электромагнитная совместимость ===
 +
...
 +
=== Шум ===
 +
...
  
 
— [[user:Yury Tarasievich|Ю.Т.]]
 
— [[user:Yury Tarasievich|Ю.Т.]]

Версия 23:42, 23 августа 2015

Параллельная вычислительная машина (система) нестрого определяется как система, в которой множественные вычисляющие узлы работают совместно над выполнением одной или многих задач – осуществляют параллельные вычисления. Эта модель отличается от фон-неймановской модели последовательной ЭВМ, в которой выполнение команд происходит лишь на одном вычисляющем-исполняющем узле (процессоре).

Архитектура этого класса ЭВМ включает два основных варианта конструктивного исполнения: кластеры и массово-параллельные системы. Также конструктивное исполнение различается по непосредственно поддерживаемой в нём модели параллельных вычислений — с общей памятью, с передачей сообщений или смешанной. Кроме того, по способу программной организации параллельной обработки выделяют классы Флинна.

Производительность

Некоторые наиболее часто употребляемые характеристики параллельных ЭВМ:

Пиковая (теоретическая, номинальная) производительность, Rpeak – величина, получаемая простым умножением количества вычисляющих устройств (процессоров, ядер и т.д.) в системе на максимальное возможное число арифметических операций (флоп; Flop – floating point operation) с плавающей запятой, производимых вычисляющим устройством за один такт сигнала синхронизации, на число тактов в секунду.

Например, один процессор Intel Itanium 2, работающий с тактовой частотой 1,5 ГГц, способен производить 4 операции с плавающей запятой за один такт и, следовательно, обладает пиковой производительностью 6 Гфлоп/с; единицу флоп/с могут употреблять в виде «флопс».

Максимальная производительность, Rmax – показатель, связанный со временем исполнения образцовой программы («бенчмарк»). В мировом списке мощнейших параллельных систем TOP500 в качестве образцовой программы используется HPL benchmark, основанная на LINPACK).

Параметр Nmax (сопряжённый с максимальной производительностью): (максимальный) счётный размер (объём) задачи, при котором был получен определённый показатель Rmax.

Параметр Nhalf (N1/2): счётный размер (объём) задачи, для которой машина показывает половину максимальной производительности. Это хороший показатель качества внутренней сети: чем Nhalf меньше, тем лучше (соотношение 1/10 считается хорошим показателем).

Проблемы построения

При построении достаточно мощных параллельных ЭВМ особо существенными становятся проблемы энергопитания; а также встраивания таких вычислительных систем в окружающую их среду.

Энергопотребление

...

Охлаждение и климатизация

...

Электромагнитная совместимость

...

Шум

...

Ю.Т.

Источники