23 juni 2014

Intel herontwerpt fundamentele bouwsteen voor high-performance computing

Intel heeft vandaag nieuwe details bekendgemaakt van de volgende generatie Intel Xeon Phi-processors, bekend onder de codenaam Knights Landing. Het gaat onder meer om een nieuwe high-speed fabric die met de processor geïntegreerd zal worden en om zeer snel, on-package geheugen. Door deze nieuwe combinatie zal de snelheid waarmee wetenschappelijke ontdekkingen kunnen worden gedaan toenemen. Momenteel zijn geheugen en fabrics als aparte componenten voor servers leverbaar, maar vormen daardoor een rem op de prestaties en de densiteit van supercomputers.


De nieuwe interconnect-technologie - Intel Omni Scale Fabric genaamd - is ontworpen om te voldoen aan de eisen van de volgende generaties high-performance computing (HPC). Intel Omni Scale Fabric zal geïntegreerd worden met de volgende generatie Intel Xeon Phi-processors alsmede met toekomstige general-purpose Intel Xeon-processors. Deze integratie, gecombineerd met de voor HPC-omgevingen geoptimaliseerde fabric-architectuur, is ontworpen om tegemoet te komen aan de eisen op het gebied van prestaties, schaalbaarheid, betrouwbaarheid, stroomvoorziening en densiteit van toekomstige HPC-installaties. Het ontwerp biedt een uitgekiende balans tussen prijs en prestaties voor zowel entry-level als omvangrijke 'extreme-level' omgevingen, aangeduid met ‘exascale’.



"Intel heeft de fundamentele bouwstenen van HPC-systemen opnieuw ontworpen door de Intel Omni Scale Fabric in Knights Landing te integreren. Dat betekent een significante mijlpaal voor de HPC-industrie ", zegt Charles Wuischpard, vicepresident en general manager van Workstations en HPC bij Intel. "Knights Landing is de eerste echte many-core processor die een antwoord biedt op de huidige geheugen- en I/O-uitdagingen. Programmeurs kunnen bestaande code en standaard programmeermodellen gebruiken en toch significante snelheidswinsten voor een brede reeks toepassingen boeken. Het platformontwerp, programmeermodel en uitgebalanceerde prestaties maken dit een eerste levensvatbare stap richting Exascale."

Knights Landing - ongeëvenaarde integratie
Knights Landing komt, naast de PCIe-kaart uitvoering, ook beschikbaar als een stand-alone processor die direct op het moederbord-socket gemonteerd wordt. Daardoor worden gangbare programmeerproblemen en bandbreedte-bottlenecks die optreden bij datatransfers over PCIe vermeden. Knights Landing zal bij de introductie tot 16GB high-bandwidth, on-package geheugen bevatten - dat samen met Micron ontwikkeld is - en tot vijf keer meer bandbreedte bieden dan DDR4-geheugen1. Daarnaast is dit geheugen vijf keer energie-efficiënter2 en biedt het drie keer de densiteit van huidig GDDR-geheugen3. Indien geïntegreerd met de Intel Omni Scale Fabric kan de nieuwe geheugenoplossing als een losstaande computerbouwsteen worden geïnstalleerd, wat ruimte en energie bespaart doordat er minder componenten zijn.

Aangedreven door meer dan zestig voor HPC geoptimaliseerde processor-cores op basis van de Silvermont-architectuur zal Knights Landing naar verwachting meer dan 3 teraflops dubbel-precisie performance leveren en drie keer de single-threaded performance4 vergeleken met de huidige generatie. Als losstaande serverprocessor ondersteunt Knights Landing DDR4 systeemgeheugen, qua capaciteit en bandbreedte vergelijkbaar met Intel Xeon processor-platforms. Hierdoor kunnen applicaties die een veel groter geheugen vereisen worden ingezet. Knights Landing is binair compatibel met Intel Xeon-processors5, waardoor programmeurs bestaande code kunnen hergebruiken.

Voor klanten die liever discrete componenten en een snel upgrade-pad willen zonder dat zij daarvoor andere systeemcomponenten moeten vernieuwen, komen Knights Landing- en Intel Omni Scale Fabric-controllers beschikbaar als aparte PCIe add-on-kaarten. Ook is er applicatiecompatibiliteit tussen de huidige Intel True Scale Fabric en de toekomstige Intel Omni Scale Fabric, waardoor klanten kunnen upgraden naar de nieuwe fabric-technologie zonder hun applicaties te hoeven wijzigen. Voor klanten die nu de Intel True Scale Fabric aanschaffen biedt Intel een upgradepad naar Intel Omni Scale Fabric wanneer deze beschikbaar komt.

Knights Landing-processors zullen naar verwachting vanaf de tweede helft van 2015 HPC-systemen gaan aandrijven. Zo annonceerde het National Energy Research Scientific Computing Center (NERSC) al een nieuwe HPC-installatie voor 2016, die ruim 5000 gebruikers zal gaan bedienen met meer dan 700 'extreme-scale' wetenschappelijke projecten.

"We zijn erg blij met de samenwerking met Cray en Intel om de volgende supercomputer genaamd 'Cori' te ontwikkelen", zegt dr. Sudip Dosanjh, directeur van NERSC dat onderdeel uitmaakt van het Lawrence Berkeley National Laboratory. "Cori zal bestaan uit meer dan 9300 Knights Landing-processors en gaat voor onze gebruikers door middel van een toegankelijk programmeermodel dienen als een oprit naar exascale-computing. Onze codes, die vaak beperkt worden door onvoldoende geheugenbandbreedte, zullen ook enorm profiteren van het snelle on-package geheugen van Knights Landing. Wij gaan daarmee nieuwe wetenschap bedrijven die met de huidige supercomputers niet mogelijk is."

Nieuwe fabric, nieuwe snelheden met Intel Omni Scale Fabric
Intel Omni Scale Fabric is gebouwd op een combinatie van door Intel gekocht en verder ontwikkeld intellectueel eigendom van Cray en Qlogic. Het zal een volledige productlijn gaan omvatten, bestaande uit adapters, edge-switches, director switches en open source software voor fabric management en andere tools. Daarnaast zullen de traditionele elektrische transceivers in de director-switches van de huidige fabrics vervangen worden door oplossingen gebaseerd op Intel Silicon Photonics. Hierdoor wordt een grotere poortdichtheid en een eenvoudiger bekabeling mogelijk, wat leidt tot lagere kosten6. Bekabelings- en tranceiver-oplossingen gebaseerd op Intel Silicon Photonics kunnen ook gebruikt worden met Intel Omni Scale-processors, adapterkaarten en edge-switches.

Intel blijft voorop met supercomputers
De huidige generatie Intel Xeon- en Intel Xeon Phi-processors vormen de motor van het snelste computersysteem ter wereld: de Chinese 'Milky Way 2' die 35 PFLOPS haalt. Intel Xeon Phi-coprocessors zijn terug te vinden in meer dan 200 OEM-ontwerpen over de hele wereld.

Uit de vandaag gepubliceerde 43ste editie van de Top500-lijst met snelste supercomputers ter wereld blijken Intel-gebaseerde systemen met 85% zeer goed vertegenwoordigd. Van alle nieuwe supercomputers op de lijst is zelfs 97% Intel-gebaseerd. Binnen achttien maanden na de introductie van Intels eerste many-core producten, nemen de Intel Xeon Phi-coprocessorsystemen al 18% van de totale rekenkracht van deze 500 supercomputers voor hun rekening. De complete Top500 is te raadplegen op www.top500.org.

Om te helpen met het optimaliseren van applicaties voor many-core processing heeft Intel in samenwerking met universiteiten en onderzoeksinstellingen over de hele wereld ook ruim dertig Intel Parallel Computing Centers (IPCC) in het leven geroepen. De huidige investeringen in code-optimalisatie voor de Intel Xeon Phi-coprocessor zullen ook gebruikt kunnen worden met Knights Landing, omdat de optimalisaties op standaarden gebaseerde, gangbare programmeertalen gebruiken en een hercompilatie van de broncode daardoor volstaat. Incrementele optimalisaties zullen in de loop der tijd beschikbaar komen om te profiteren van innovatieve nieuwe functionaliteit.


Intel, Xeon, Intel Xeon Phi, Intel Atom and the Intel logo are trademarks or registered trademarks of Intel Corporation or its subsidiaries in the United States or other countries.
*Other brands and names may be claimed as the property of others.

All products, computer systems, dates and figures specified are preliminary based on current expectations, and are subject to change without notice.
Intel may make changes to specifications and product descriptions at any time, without notice.  Designers must not rely on the absence or characteristics of any features or instructions marked "reserved" or "undefined".  Intel reserves these for future definition and shall have no responsibility whatsoever for conflicts or incompatibilities arising from future changes to them.  The information here is subject to change without notice.  Do not finalize a design with this information.

The products described in this document may contain design defects or errors known as errata which may cause the product to deviate from published specifications.  Current characterized errata are available on request.

Intel’s compilers may or may not optimize to the same degree for non-Intel microprocessors for optimizations that are not unique to Intel microprocessors. These optimizations include SSE2®, SSE3, and SSSE3 instruction sets and other optimizations. Intel does not guarantee the availability, functionality, or effectiveness of any optimization on microprocessors not manufactured by Intel. Microprocessor-dependent optimizations in this product are intended for use with Intel microprocessors. Certain optimizations not specific to Intel microarchitecture are reserved for Intel microprocessors. Please refer to the applicable product User and Reference Guides for more information regarding the specific instruction sets covered by this notice.

Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors.  Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions.  Any change to any of those factors may cause the results to vary.  You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. 

Results have been measured by Intel based on software, benchmark or other data of third parties and are provided for informational purposes only.  Any difference in system hardware or software design or configuration may affect actual performance.  Intel does not control or audit the design or implementation of third party data referenced in this document.  Intel encourages all of its customers to visit the websites of the referenced third parties or other sources to confirm whether the referenced data is accurate and reflects performance of systems available for purchase”

1 Projected result based on internal Intel analysis of STREAM benchmark using a Knights Landing processor with 16GB of high-bandwidth 
   versus DDR4 memory only with all channels populated
2 Projected results based on internal Intel analysis of Knights Landing MCDRAM vs Knights Corner (GDDR5)
3 Internal projections, projected theoretical double-precision performance when measured by Linpack
4. Projected peak theoretical single-thread performance relative to 1st Generation Intel® Xeon Phi™ Coprocessor 7120P (formerly code-named Knights 
    Corner)
5 Binary Compatible with Intel Xeon processors using Haswell Instruction Set (except TSX)
6 The TCO or other cost reduction scenarios described in this document are intended to enable you to get a better understanding of how the purchase of
   a given Intel product, combined with a number of situation-specific variables, might affect your future cost and savings.  Circumstances will vary and
   there may be unaccounted-for costs related to the use and deployment of a given product.  Nothing in this document should be interpreted as either a 
  promise of or contract for a given level of costs.”

Geen opmerkingen:

Een reactie plaatsen