1. Klasyczne miary wydajności Cechy miar wydajności



Pobieranie 474,88 Kb.
Strona1/6
Data04.11.2017
Rozmiar474,88 Kb.
  1   2   3   4   5   6

1.Klasyczne miary wydajności

2.Cechy miar wydajności

3.Kategorie miar wydajnosci

4.Miar syntetyczne

5.Jadra programowe

6.LINPACK

7.Aplikacje SPEC

8. SAP


9. TPC

10. Elementy RAS, MTBF, MSBF itd

11. CISC

12 .RISC


13 .EPIC

14. Systemy wysokiej niezawodnosci

15 .HAC klastry

16. 64-bit computing

17. ECC

18. Wiarygodnosc, uszkodzenia, atrybuty



19. Redundancja Poziomy redundancji

20. System pracy ciaglej

21. Podzial systemow, inaczej

22. serwisowanie

23. stadia projektu HA

24. ochrona danych

25. Disk Storage Systems
1.

Klasyczne miary wydajności

• MIPS


Million Instructions per Second

the most useless benchmark everinvented

– wyniki mają się nijak w stosunku dowydajności w rzeczywistychzastosowaniach

– nieporównywalne wyniki dlaróżnych architektur procesorów(CISC vs. RISC)

– 1 MIPS <>DEC VAX11/780

– IBM MIPS (S390)

• MFLOPS (Mflop/s)

Million Floating PointOperations per Second

– LINPACK (wydajnośćteoretyczna i rzeczywista)

– teoretyczna wydajność jestniemiarodajna nieuwzględnia operacji I/O


2. Cechy miar wydajności ---> HAV

napisane w językach programowania wysokiego poziomu (przenośność) ,reprezentacja dla wybranej klasy rzeczywistych zastosowań,łatwość modyfikacji (postęp w algorytmach, metodach optymalizacji, technologii) ,szeroki zakres testowanych elementów składowych systemu i współpracy z oprogramowaniem,pomiary łatwe do realizacji,akceptowane,
3.Kategorie miar wydajności --> HAV

syntetyczne miary wydajności (podstawowe operacje) - Dhrystone i Whetstone

jądra programowe (kernels) wybrane fragmenty rzeczywistych programów, m.in. Livermore Fortran Kernels i NAS Kernel Benchmark Program

algorytmy - programy testowe, np. LINPACK
aplikacje (kompletne) (fizyka, chemia lub wspomaganie zarządzania), np. Perfect Benchmarks, ParkBench, z rodziny SPEC, SAP, NotesBench i Baan

specyfikacje - stanowią zbiór wymagań funkcjonalnych realizowanych przy dowolnej implementacji sprzętowej i programowej, np. miary z rodziny TPC

4. Miary syntetyczne
Whetstone (1976) obliczenia numeryczne; wywołania funkcji z biblioteki matematycznej (np. sin(.), exp(.)); Algol i Pascal
benchmark testujący operacje zmiennoprzecinkowe; wyniki są wyrażane w whetstones na sekundę. Whetstone I testuje operacje 32-bitowe, a Whetstone II - operacje 64-bitowe.
Dhrystone (1984) - zastosowania nienumeryczne stałoprzecinkowe (instr. warunkowe i wywołania procedur), systemy operacyjne, kompilatory, czy edytory; ADA i C
benchmark wykonujący ogólny zestaw instrukcji; wynik w dhrystones na sekundę oznacza liczbę wykonań programu w ciągu jednej sekundy.
5.Jądra programowe
Livermore Fortran Kernels
Różnica między LFK Mflop/s i Rpeak Mflop/s !!
NAS Kernels (Fortran)
jądra
EP - generacja liczb pseudolosowych - mała komunikacja
MG - obliczenia wielosiatkowe - duża komunikacja
CG - met. gradientów sprzężonych - wartośći własne macierzy rzadkiej
FT - cząstkowe równania różniczkowe met. FFT

IS - sortowanie



programy

LU - równania liniowe met. trangulacji

SP - równania liniowe macierzy gęstej

BT - jak SP - met. blokową


6.Algorytmy: -- LINPACK*


biblioteka algebry liniowej

macierz gęsta

R (testy)

DP Mflop/s (100x100)

TPP Mflop/s (1000x1000)

Rpeak Mflop/s

Liczba operacji (n - liczba równań)

Linpack Parallel (analogiczny)

Metryki:

Rmax – najlepszy wynik

Nmax – rozmiar problemu, dla którego uzyskano najlepszy wynik

N1/2 – rozmiar układu dla którego uzyskano połowę Rmax

Rpeak – wydajność teoretyczna

7.Aplikacje: -- SPEC


miary dla komputerów systemów otwartych

Trzy grupy robocze:

Open Systems Group - miary dla UNIX, NT, VMS; najważniejsze z nich to CINT95 i CFP95;

High Performance Computing Group -- ocena wydajności systemów przeznaczonych dla intensywnych obliczeń numerycznych dużej skali;

Graphics Performance Characterization Group -- dla podsystemów graficznych oraz środowisk OpenGL i Xwindows.

Podstawowe zestawy SPEC:

CPU95 i CPU2000

GPC, SFS, web96/web99, jvm98

Metryki SPEC CPU

base – testy skompilowane z

wykorzystanie podstawowej optymalizacji

peak – optymalizacja agresywna

rate – ilość zadań wykonanych w

ustalonym przedziale czasu


8.Aplikacje: SAP


System do wspomagania zarządzania

Używany przez duże międzynarodowe koncerny

~15000 instalacji

architektura klient-serwer

model dwuwarstwowy

model trzywarstwowy R/3


warstwy: danych * aplikacji * prezentacji*

Metryki:

liczba użytkowników

średni czas odpowiedzi < 2 s

przepustowość konfiguracji (w SAPS) - liczba kroków dialogu/godz.

Opis modułów benchmarku SAP R/3 (SD, FI, MM, PP, WM, PS, HR)

CPU2000


( średnia geom. miar ),CINT2000,Kompresja danych (C),Projektowanie układów FPGA (C),Kompilator języka C (C),optymalizacja - minimalizacja (C),gra w szachy (C),Przetwarzanie języka naturalnego (C),raytracing (C++),przetwarzanie w języku Perl (C),teoria grup (C),

CFP2000


chromodynamika kwantowa (F77),model dynamiki wody (F77),solwer wielosiatkowy 3D - pole potencjalne (F77),solwer dla równań parabolicznych i eliptycznych (F77),biblioteka graficzna w 3D (C),CFD (F90),rozpoznawanie obrazów - sieci neuronowe (C),propagacja fal sejsmicznych (C),przetwarzanie obrazów - identyfikacja twarzy (F90),chemia obliczeniowa (C),testowanie liczb pierwszych (F90),FEM - zderzenia (F90),projektowanie akceleratora (F77),rozchodzenie się zanieczyszczeń (F77),

Aplikacje: SAP


• System do wspomagania

zarządzania: mySAP.com

• Używany przez duże międzynarodowe koncerny

• ~15000 instalacji

• architektura klientserwer

– model dwuwarstwowy– model trzywarstwowy R/3

warstwy:

• danych• aplikacji• prezentacji

• Metryki:

– liczba użytkowników– średni czas odpowiedzi < 2 s– Przepustowość konfiguracji(w SAPS) liczba kroków dialogu/godz.

Platforma

• Architektura 2warstwowa

– Warstwa prezentacji

– Warstwa bazy danych i aplikacji

• Architektura 3warstwowa

– Warstwa prezentacji

Warstwa aplikacji

- Warstwa bazy danych

Metryka Baan

• BRU – Baan Reference User

– 1 BRU: użytkownik generujący obciążenie

referencyjne

• W czasie testu, generator powiększa liczbę

współbieżnie pracujących BRU, do momentu gdy czas odpowiedzi przekroczy pewien ustalony limit


9.TPC-C


On-line Transaction Processing, 1992 mieszanka transakcji zapisu, odczytu, usuwania i aktualizacji elementy:

jednoczesne wykonywanie transakcji, transakcje on-line i odroczone, wiele sesji, umiarkowane czasy systemowe i aplikacji,

znaczne wykorzystanie pamięci dyskowej i i/o, transakcje ACID (atomicity, consistency, isolation durability), nierównomierny dostęp do danych - klucze pierwotne i wtórne ,wiele zróżnicowanych tablic , współzawodnictwo w dostępie do danych i ich aktualizacji

Metryki TPC-C


tpmC (trans/min) dla nowych zamówień przy jednoczesnej obsłudze pozostałych

$/tpmC ($ - koszt zakupu i utrzymania przez 5 lat)

wymagana ostrożność przy interpretacji wyników

TPC-D


zakres DSS (Decision Support Side of Business)

wspieranie wspomagania decyzji, eksploracja danych (data mining)

cel:

pozyskanie danych z dużych baz (OLTP)



agregacja - analiza - informacji

zastosowanie:

duża objętość danych

niewielka liczba zapytań

duża złożoność zapytań

QppD (Query Processing Performance) wydajność obsługi zapytań, gdy cała moc skierowana do obsługi pojedynczego strumienia zapytań

QthD (Query Throughput) liczba zapytań (w 1 godz) przetworzonych współbieżnie - wiele strumieni danych

$/QphD ($/Queries per hour)

QphD = (QppD x QthD)1/2

różne wielkości baz danych: 1GB, 10GB, 30GB, 100GB, 1TB, 3TB



Baza tworzona przez DBGEN (w C jako element zestawu)

TPC-H i TPC-R


T
PC-H - ad hoc (TPC-D) bez znajomości istoty zapytań

TPC-R - predefiniowany zestaw zapytań

Metryki:

QphH lub QphR

QthH lub QthR

$/QphH lub $/QphR


10.Elementy RAS


RAS w odniesieniu do procesorów
(RAS: Reliability, Availability, Serviceability)

niezawodność (reliability),

dostępność (availability),

przychylny serwis (serviceability)



Wydajność:

mała liczba (mniej elementów) versus duża liczba procesorów (większe możliwości redundancji)

Architektura - wykorzystuje daną technologię

POWER, IA-64, PA-RISC ,

Procesor - realizacja sprzętowa architektury

POWER2, Itanium, PA-8500,

Technologia półprzewodnikowa

ECL, CMOS, GaAs,

Wysoka niezawodność systemu wiąże się ściśle z problemem zapewnienia wysokiej dostępności (ang. High Availability). Problem ten uwzględnia wszystko począwszy od architektury systemu poprzez platformę sprzętową aż po kod aplikacji.

Systemy pracy ciągłej określa się często nazwą RAS, która ma swoje źródło w nazwach wymagań:



1) niezawodność „R” (ang. Reliability) – mierzona średnim czasem między uszkodzeniami MTTF lub MTBF

2) dostępność „A” (ang. Avalilability) – procent dostępności systemu dla użytkownika

3) serwisowanie „S” (ang. Serviceability) – średni czas usunięcia uszkodzenia MTTR gdzie, dostępność wyznaczamy ze wzoru: A = MTTF / (MTTF + MTTR)

MTBF (ang. Mean Time Between Failure, fr. Moyenne Temps de Bon Fonctionnement; brak polskiego odpowiednika ze względu na powszechne stosowanie angielskiego skrótu). Określany na podstawie statystycznych badań niezawodności średni czas międzyawaryjny. Ma ustaloną wartość liczbową tylko przy stałej intensywności uszkodzeń.

MTBF = MTFF + MTTR = Eτ + Eτr

Jest to średni czas wyliczany statystycznie dla danej serii dysków. Przy jego pomocy można określić jakie jest prawdopodobieństwo uszkodzenia urządzenia przez rok użytkowania. Parametr MTBF jest często stosowany do określania żywotności twardych dysków.

MTBF (Mean Time Between Failure)- wyrażony w godzinach pracy, oznacza czas bezawaryjnej pracy układów elektronicznych urządzenia. Im ten parametr jest wyższy tym urządzenie bardziej niezawodne.

MTTR, ang. Mean Time To Repair, średni czas naprawy. Czas potrzebny na doprowadzenie urządzenia do stanu funkcjonalnego sprzed awarii.

MTTR - akronim angielskiego wyrażenia mean time to repair (średni czas naprawy), oznaczający w branży komputerowej średni czas, wyrażony w godzinach, wymagany do naprawy uszkodzonego urządzenia od momentu wystąpienia awarii.

Niezawodność (ang. reliability) jest to własność obiektu mówiąca o tym, czy pracuje on poprawnie (spełnia wszystkie powierzone mu funkcje i czynności) przez wymagany czas i w określonych warunkach eksploatacji (w danym zespole czynników wymuszających).

Niezawodność obiektu jest określona przez prawdopodobieństwo wystąpienia zdarzenia opisanego definicją:

MSBF (Mean Swaps Between Failure)- parametr techniczny dotyczący niezawodności układu robotyki, oznacza ilość cykli wymiany nośnika, im wartość wyższa tym układ robotyki bardziej niezawodny.

11.Technologia CISC


Najwcześniej rozwinięta technologia

CISC oznacza procesor o złożonej, obszernej, liście rozkazów różnej długości

Różnice w długościach poszczególnych instrukcji mogą być znaczne, np. dla komputera VAX wahały się od 4 do kilkuset.

Komplikują w wysokim stopniu analizę i optymalizację kodu i utrudniają uzyskanie równoległości na poziomie realizacji poszczególnych instrukcji. W wyniku tego niemożliwe jest uzyskanie wysokiej wydajności.

Niełatwe jest również zwiększenie częstotliwości pracy, gdyż realizacja architektury wymaga dużej ilości materiału, co wiąże się z koniecznością odprowadzenia ciepła i podnosi koszty produkcji.

Najczęściej technologia CISC realizowana jest w formie procesorów wieloukładowych. Ten typ technologii procesorowej charakterystyczny jest dla wcześniejszych rozwiązań, np. dla

komputerów typu mainframe; jego elementy implementowane były w procesorach Intel Pentium oraz przez innych producentów (np. AMD, Cyrix).

Obecnie technologia CISC wyraźnie traci na znaczeniu.


12.Technologia RISC


Zwielokrotnione jednostki funcjonalne - superskalarność, np. 200MHz, 4-drożny --> 800 Mflop/s

Procesory jednoukładowe

Rozbudowane bufory i rejestry;

optymalizacja kolejności wykonywania obliczeń (out-of-order)

organizacja przetwarzania skalarnego

organizacja przetwarzania potokowego

Duża pamięć podręczna cache

dla danych

dla instrukcji

L1 L2


Modyfikacja technologii półprzewodnikowej

ścieżki miedziane


13.Techologia EPIC, architektura IA-64


Very Long Instruction Word; Cechy:

przeglądanie instrukcji przed wykonaniem - technika predykcji

wykorzystanie długich rozkazów stałej długości (nowy format 128 bitów zawierający 3 instrukcje)

możliwość eliminacji rozgałęzień kodu - technika predykcji

procesor ITANIUM

system operacyjny:

Win64

IA-64 Linux (projekt Trillian)



Monterey 64 (IBM i SCO)

HP-UX


Modesto (Novell)

14.Systemy wysokiej niezawodności ( High Availability Systems )

Strategia tworzenia HAS


Określenie kosztów przestoju systemu informat..

Określenie kosztów, które można można ponieść dla instalacji HAS



Przydatne pojęcia:

disaster recovery

Pamięć wspólna (współdzielona) - shared memory

łatwość programowania - trudno skalowalna

Pamięć rozproszona - distributed memory

trudno programować - łatwiejsza skalowalność

Pamięć wirtualnie wspólna - virtual shared

OpenMP

15, HAC


High Availability Clusters - podklasa Parallel SMP

Systemy sieciowe (rozproszone) versus klastry



Klastry (systemy roproszone):

Przeznaczenie:do obliczeń o wysokiej złożoności (rozproszenie aplikacji)

wysokiej dostępności (realizacja lokalna aplikacji z możliwością migracji procesów),

użytkowanie, dedykowane, sieciowe, zasoby, dyski dzielone, dyski lokalne, SMP z pamięcią dzieloną, Zastosowaniaprzemysłowe, i komercyjne, obliczenia n-t, przetwrzanie transakcyjne, eksploracja danych, architektury wieloprocesorowe,


atrybuty:

największa wydajność komputera, wydajność poszczególnego węzła, (mała liczba węzłów), wysoka dostępność (duża liczba węzłów), ---> optymalizacja ,


3 wartstwowa architektura: Przetwarzanie rozproszone --transakcyjne


zarządzanie regułami, zarządzanie danymi, logika aplikacji, zarządzanie i logika prezentacji,


  1   2   3   4   5   6


©operacji.org 2017
wyślij wiadomość

    Strona główna