Производительность бета-версии на платформе PowerPC

Мы провели сравнения бета версии Автоматического Распараллеливателя с наиболее эффективных компиляторов для платформы PowerPC - xlc 10.1, а также самого распространненого компилятора gcc версии 4.3.1, который также используется Автоматическим Распараллеливателем. Сравнения производились на 5 задачах из пакета SPEC/CPU2006 и на 6 задачах из пакета NAS Parallel Benchmarks 3.3. Для замеров мы использовали машину:
2 x PPC970FX 2.2GHz with 4Gb memory onboard

Замеры производились на машинах, предоставленных Межведомственным Суперкомпьютерным центром.

Флаги компиляции:

xlc xlc -O3 -qtune=auto -qarch=auto -qipa
xlc + smp xlc -O3 -qtune=auto -qarch=auto -qipa -qsmp
gcc gcc -O2
utl [смотри ниже]

Замеры на задачах из пакета SPEC/CPU2006

Опции utl, которые использовались для компиляции задач из пакета SPEC/CPU2006:

410.bwaves -Ws,--alias-fortran -Ws,--strict-types
437.leslie3d -Ws,--alias-fortran -Ws,--strict-types
459.GemsFDT -Ws,--inter-module -Ws,--alias-fortran -Ws,--strict-types
462.libquantum -Ws,--inter-module -Ws,--pto-wilson
470.lbm -Ws,--inter-module -Ws,--pto-wilson

Ниже приведены результаты сравнения. Сначала в виде диаграмы, затем в виде таблицы с результатами замеров.

Performance
Performance

Замеры на задачах из пакета NAS Parallel Benchmarks

Опции utl, которые использовались для компиляции задач из пакета NAS Parallel Benchmarks:

BT -Ws,--strict-types -Ws,--alias-fortran -Ws,--opt-force -Ws,--inter-module -Ws,--inline -Ws,--localize -Ws,--lowerscope
CG -Ws,--alias-fortran -Ws,--inter-module -Ws,--inline
EP -Ws,--strict-types -Ws,--alias-fortran -Ws,--inter-module -Ws,--inline -Ws,--lowerscope
MG -Ws,--strict-types -Ws,--alias-fortran -Ws,--inter-module -Ws,--inline
SP -Ws,--strict-types -Ws,--alias-fortran -Ws,--inter-module -Ws,--inline -Ws,--localize -Ws,--lowerscope -Ws,--inline
UA -Ws,--strict-types -Ws,--alias-fortran -Ws,--inter-module -Ws,--inline

Ниже приведены результаты сравнения. Сначала в виде диаграмы, затем в виде таблицы с результатами замеров.

Performance
Performance

* - задачи MG и CG измерялись на входных данных класса B. Это было сделано, чтобы уменьшить погрешность изменения, так как на данных классе A эти задачи работают крайне бысто.
Все остальные задачи измерялись на входных данных класса A.