Párhuzamos és Grid rendszerek 3. előadás

Tipp: a diák között a J és K billentyűkkel lehet lépkedni.

Letöltés

1.

Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemez k Szeberényi Imre BME IIT <szebi@iit.bme.hu> M Párhuzamos és Grid rendszerek © BME-IIT Sz.I. EGYETEM 1782 2013.02.25. -1-

2.

Hol tartunk ? • Megismerkedtünk az alapfogalmakkal, architektúrákkal. • Egyszer absztrakciós modellt alkottunk a párhuzamos gépek leírására. • Megismertük a párhuzamos programok tervezésének egy módszerét (PCAM). Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -2-

3.

Klaszter • Párhuzamos rendszerek fejl désének egyik fontos állomása, amit ma több gyártó ismét el vett. – – – – közös állományrendszer laza szoros csatolás batch feldolgozás hosszútávú ütemezés Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -3-

4.

Klaszterek története • Kezdetek: szg. hálózatok megjelenése – 60as évek vége 70-es évek eleje. • Igazi fejl dés a 70-es évek vége, 80-as évek eleje. (DEC, VAXcluster) – elosztott, párhuzamos számítás – megosztott fájlrendszer – megosztott perifériák Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -4-

5.

Klaszterek ma • Nagy rendelkezésre állást biztosító klaszter • Terheléskiegyenlít klaszter • Számítási klaszter – házi: beowulf – gyártóktól: TOP500 • Grid klaszter – grid site-ok • Elosztott + redundáns adattárolás, big data – Hadoop Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -5-

6.

TOP 500 2012 november Csak 5. az els európai A 8. pedig kínai Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -6-

7.

Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -7-

8.

Architektúra alakulása Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -8-

9.

Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -9-

10.

Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 10 -

11.

TOP 500 2012 november • 84.4% legalább 6 magos, 46% pedig legalább 8 magos • 100. helyen 243.9 Tflop/s az 500. helyen 76.5 Tflop/s • 75.8% INTEL • 12% AMD Opteron • 10% IBM Power • IBM 193  HP: 146 Cray: 31 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 11 -

12.

TOP 500 2012 november • • • • • 45% InfiniBand (2x nagyobb telj. adnak) 37% Gigabit Ethernet Power eff.: 2450Mflops/watt- 90Mflops/watt Kínában 72 rendszer, Japánban 31 Angliában, Franciaországban, Németországban közel azonos: 24, 21, 19 • Linux: 469, UNIX: 20, Windows: 3 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 12 -

13.

Összeköttetések • Myrinet – 10G, réz v. üveg • Gigabit Ethertnet – 1G, réz v. üveg • Infiniband – 10-300 Gbit/s, réz • NUMAlink – 7.5G, réz Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 13 -

14.

Fájlrendszerek • NFS (NFS 1,2,3,4) (1985, Sun) – V4-et kivéve állapotmentes • AFS (CMU) – Kerberos, – nagy cache, nagy cellaszám – jól skálázható • SFS (Lustre, Sun) – objektum orientált – jól skálázható Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 14 -

15.

Ütemez k • • • • • • • • Condor (Uni. of Wisconsin) DQS (Florida State Uni) LoadLeveler (IBM) Maui, Moab (Cluster Resources) LSF (Platform) PBS, OpenPBS (Alatair) Sun Grid Engne (SUN) Torque (Cluster Resources) Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 15 -

16.

A Condor rendszer jellemz i Speciális ütemez (batch) rendszer – Elosztott, heterogén rendszerben m ködik. – Alapvet en a szabad CPU ciklusok kihasználására tervezték. – Képes egy m köd feladatot áthelyezni az egyik gépr l a másikra (migráció). – Az ún. ClassAds mechanizmussal képes a rendszerben lev változó er forrásokat az igényeknek megfelel en elosztani. – Opportunista környezet. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 16 -

17.

Condor pool Központi ütemez Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 17 -

18.

ClassAds lényege • A rendszerben lev er források különböz jellemz kkel (teljesítmény, architektúra, op. rendszer, stb.) rendelkeznek. • A job összeállításánál ezekre a jellemz kre igényeket lehet el írni, amit a Condor rendszer megpróbál kielégíteni. (Párosítja az igényt az er forrással) • A job összeállításánál lehet ség van preferenciák megadására, ami alapján a Condor rangsorolni fog és kiválasztja az igénynek leginkább megfelel gépet. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 18 -

19.

ClassAds lényege (2) • Így nincs szükség a batch rendszerekben megszokott sorokra. (Úgyis a rosszat választanánk) Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 19 -

20.

Követelmény és rangsor • Követelmény: Requirements = Arch=="SUN4u” Pontosan kell illeszkednie. • Rangsor: Rank = Memory + Mips Ha választhat, akkor a nagyobbat fogja választani Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 20 -

21.

A dolgok két oldala (1) A kifejezések a két hirdetés adatterében értékel dnek ki (adA, adB). Felhasználó (igényl ) oldala: Requirements = Arch == "INTEL" && OpSys == "LINUX" Rank = TARGET.Memory * 10 + TARGET.Disk + Mips Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 21 -

22.

A dolgok két oldala (2) Er forrás oldal: Friend = Owner == "haver" Trusted = Owner != "judas" Mygroup = Owner == "zoli" || Owner == "jani" Requirements = Trusted && (Mygroup || LoadAvg < 0.5 && KeyboardIdle > 10*60) Rank = Friend + MyGroup*10 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 22 -

23.

Feladatkörök • • • • Central Manager Execute Machine Submit Machine Checkpoint Server Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 23 -

24.

Condor Pool = Process Spawned = ClassAd Communication Pathway Central Manager (Frieda’s) Cluster Node master master startd schedd negotiator startd Cluster Node collector master startd Desktop master startd schedd Párhuzamos és Grid rendszerek © BME-IIT Sz.I. Desktop master startd schedd 2013.02.25. - 24 -

25.

Job indítás Schedd Startd Starter Shadow Submit Párhuzamos és Grid rendszerek © BME-IIT Sz.I. Customer Job Condor Syscall Lib 2013.02.25. - 25 -

26.

Condor flock Condor job-ok personal your Condor Pool workstation Condor "Barát" Condor Pool Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 26 -

27.

Milyen feladatok lehetnek ? • Els sorban hosszú futási idej , számításigényes feladatok. • Különböz univerzumok léteznek – – – – – Standard Vanilla MPI Grid Java Párhuzamos és Grid rendszerek © BME-IIT Sz.I. – – – – Scheduler Local Parallel VM 2013.02.25. - 27 -

28.

Standard univerzum • checkpointing, automatikus migráció • meglev programot újra kell fordítani, esetleg csak linkelni • az alkalmazás nem használhat bizonyos rendszerhívásokat: pl. fork, socket, alarm, mmap • („elkapja” a file m veleteket) Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 28 -

29.

Vanilla univerzum • nincs checkpointing, nincs migráció • meglev futtatható kódot nem kell vátoztatni • nincs korlátozás a rendszerhívásokkal szemben. • NFS, vagy AFS kell !!!! Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 29 -

30.

PVM univerzum • • • • • • MW jelleg PVM programok környezete Binárisan kompatibilis PVM 3.4.2 + taszk kezeléshez kieg. Dinamikus VM kialakítás. Heterogén környezet támogatása Egy user csak egy példányban futathat deamont Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 30 -

31.

Condor felépíti a virtuális gépet Master pmvd Slave pmvd PVM alkalmazás M S S #1 #2 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. S #3 S #4 S C #5 #6 2013.02.25. - 31 -

32.

MPI univerzum • • • • • • MPICH változtatás nélkül. Bináris kompatibilitás Csak ch_p4 device Dinamikusan nem változhat Nem állhat meg. NFS vagy AFS kell. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 32 -

33.

Futtatás lépései • A job összeállítása • Job bejelentése a Condor-nak • Job-ot a Condor futtatja az általa kiválasztott gép(eken), szükség esetén átmozgatja egy másik gépre. • Job befejez dik, a Condor e-mail-t küld a felhasználónak. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 33 -

34.

Egy egyszer jobleíró universe = vanilla executable = mathematica input = in$(Process).dat output = out$(Process).dat queue 50 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 34 -

35.

Egy másik jobleíró universe = vanilla executable = /bin/hostname output = hostname.out.$(Process) error = hostname.err.$(Process) log = hostname.log queue 3 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 35 -

36.

Sun Grid Engine (SGE) • • • • • • • A Condor-hoz hasonló ütemez . Queue-kat definiál. Hangsúlyos a terhelés kiegyensúlyozása. Backup master ütemez . Check-point. Migrálási lehet ség. Négy szerepkör: – master, submit, exec, admin, Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 36 -

37.

SGE komponensei Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 37 -

Utolsó frissítés: 2013-03-12 22.25