Für eine neue Prozessorarchitektur ist eine detaillierte Bewertung in Bezug auf Energie, Fläche und Leistung wichtig. Der Vergleich von Prozessorarchitekturen anhand von Zahlen in der Literatur ist jedoch schwierig. Dafür gibt es verschiedene Gründe: Benchmarks sind nicht gleich, Speicher und ihre Schnittstellen werden oft nicht berücksichtigt, Architekturen werden nur funktional simuliert, und Energiezahlen werden entweder nicht erwähnt, oder es ist nicht klar, was in diesen Zahlen enthalten ist und was nicht. Um eine faire Bewertung von Blocks im Vergleich zu Referenzarchitekturen (eine SIMD, eine VLIW und eine traditionelle CGRA) zu ermöglichen, werden diese Architekturen auf der Grundlage der von Blocks unterstützten Funktionseinheiten implementiert. Auf diese Weise sind die Befehlssatzarchitektur, der ASIC-Technologieknoten, die Speicherarbitrierung usw. alle vergleichbar. Außerdem wird Blocks mit einem ARM Cortex-M0 verglichen. Alle Architekturen wurden mit einem 40 nm Low-Power-Technologieknoten synthetisiert, platziert und geroutet. Die Ergebnisse zeigen, dass Blocks den Rekonfigurations-Overhead signifikant reduziert, sogar im Vergleich zu einem bereits optimierten, aber traditionelleren, CGRA. Blocks reduziert den Rekonfigurationsenergie-Overhead zwischen 46 % und 76 % (durchschnittlich 60 %). Die Energiereduzierung auf Systemebene liegt zwischen 9 % und 29 % (durchschnittlich 22 %). Trotz des Rekonfigurations-Overheads ist der Energieverbrauch von Blocks im Vergleich zu den festen SIMD- und VLIW-Prozessoren um das 2,1fache bzw. 1,8fache niedriger. Darüber hinaus ist der Energieverbrauch von Blocks im Vergleich zu einem ARM Cortex-M0-Prozessor um mehr als das 8-fache niedriger, während gleichzeitig eine 68,9-fache Beschleunigung erreicht wird.
Anzeige
Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.