Párhuzamos és Grid rendszerek 3. előadás
Letöltés
- Nyomtatáshoz, 3 dia/lap (3.1M)
- Nyomtatáshoz, 6 dia/lap (3.1M)
- Képernyőre, 1 dia/lap (színes) (1.2M)
- E-könyv olvasóhoz, 1 dia/lap (3.1M)
1.
Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemez k Szeberényi Imre BME IIT <szebi@iit.bme.hu> M Párhuzamos és Grid rendszerek © BME-IIT Sz.I. EGYETEM 1782 2013.02.25. -1-
2.
Hol tartunk ? • Megismerkedtünk az alapfogalmakkal, architektúrákkal. • Egyszer absztrakciós modellt alkottunk a párhuzamos gépek leírására. • Megismertük a párhuzamos programok tervezésének egy módszerét (PCAM). Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -2-
3.
Klaszter • Párhuzamos rendszerek fejl désének egyik fontos állomása, amit ma több gyártó ismét el vett. – – – – közös állományrendszer laza szoros csatolás batch feldolgozás hosszútávú ütemezés Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -3-
4.
Klaszterek története • Kezdetek: szg. hálózatok megjelenése – 60as évek vége 70-es évek eleje. • Igazi fejl dés a 70-es évek vége, 80-as évek eleje. (DEC, VAXcluster) – elosztott, párhuzamos számítás – megosztott fájlrendszer – megosztott perifériák Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -4-
5.
Klaszterek ma • Nagy rendelkezésre állást biztosító klaszter • Terheléskiegyenlít klaszter • Számítási klaszter – házi: beowulf – gyártóktól: TOP500 • Grid klaszter – grid site-ok • Elosztott + redundáns adattárolás, big data – Hadoop Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -5-
6.
TOP 500 2012 november Csak 5. az els európai A 8. pedig kínai Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. -6-
11.
TOP 500 2012 november • 84.4% legalább 6 magos, 46% pedig legalább 8 magos • 100. helyen 243.9 Tflop/s az 500. helyen 76.5 Tflop/s • 75.8% INTEL • 12% AMD Opteron • 10% IBM Power • IBM 193 HP: 146 Cray: 31 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 11 -
12.
TOP 500 2012 november • • • • • 45% InfiniBand (2x nagyobb telj. adnak) 37% Gigabit Ethernet Power eff.: 2450Mflops/watt- 90Mflops/watt Kínában 72 rendszer, Japánban 31 Angliában, Franciaországban, Németországban közel azonos: 24, 21, 19 • Linux: 469, UNIX: 20, Windows: 3 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 12 -
13.
Összeköttetések • Myrinet – 10G, réz v. üveg • Gigabit Ethertnet – 1G, réz v. üveg • Infiniband – 10-300 Gbit/s, réz • NUMAlink – 7.5G, réz Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 13 -
14.
Fájlrendszerek • NFS (NFS 1,2,3,4) (1985, Sun) – V4-et kivéve állapotmentes • AFS (CMU) – Kerberos, – nagy cache, nagy cellaszám – jól skálázható • SFS (Lustre, Sun) – objektum orientált – jól skálázható Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 14 -
15.
Ütemez k • • • • • • • • Condor (Uni. of Wisconsin) DQS (Florida State Uni) LoadLeveler (IBM) Maui, Moab (Cluster Resources) LSF (Platform) PBS, OpenPBS (Alatair) Sun Grid Engne (SUN) Torque (Cluster Resources) Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 15 -
16.
A Condor rendszer jellemz i Speciális ütemez (batch) rendszer – Elosztott, heterogén rendszerben m ködik. – Alapvet en a szabad CPU ciklusok kihasználására tervezték. – Képes egy m köd feladatot áthelyezni az egyik gépr l a másikra (migráció). – Az ún. ClassAds mechanizmussal képes a rendszerben lev változó er forrásokat az igényeknek megfelel en elosztani. – Opportunista környezet. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 16 -
18.
ClassAds lényege • A rendszerben lev er források különböz jellemz kkel (teljesítmény, architektúra, op. rendszer, stb.) rendelkeznek. • A job összeállításánál ezekre a jellemz kre igényeket lehet el írni, amit a Condor rendszer megpróbál kielégíteni. (Párosítja az igényt az er forrással) • A job összeállításánál lehet ség van preferenciák megadására, ami alapján a Condor rangsorolni fog és kiválasztja az igénynek leginkább megfelel gépet. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 18 -
19.
ClassAds lényege (2) • Így nincs szükség a batch rendszerekben megszokott sorokra. (Úgyis a rosszat választanánk) Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 19 -
20.
Követelmény és rangsor • Követelmény: Requirements = Arch=="SUN4u” Pontosan kell illeszkednie. • Rangsor: Rank = Memory + Mips Ha választhat, akkor a nagyobbat fogja választani Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 20 -
21.
A dolgok két oldala (1) A kifejezések a két hirdetés adatterében értékel dnek ki (adA, adB). Felhasználó (igényl ) oldala: Requirements = Arch == "INTEL" && OpSys == "LINUX" Rank = TARGET.Memory * 10 + TARGET.Disk + Mips Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 21 -
22.
A dolgok két oldala (2) Er forrás oldal: Friend = Owner == "haver" Trusted = Owner != "judas" Mygroup = Owner == "zoli" || Owner == "jani" Requirements = Trusted && (Mygroup || LoadAvg < 0.5 && KeyboardIdle > 10*60) Rank = Friend + MyGroup*10 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 22 -
23.
Feladatkörök • • • • Central Manager Execute Machine Submit Machine Checkpoint Server Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 23 -
24.
Condor Pool = Process Spawned = ClassAd Communication Pathway Central Manager (Frieda’s) Cluster Node master master startd schedd negotiator startd Cluster Node collector master startd Desktop master startd schedd Párhuzamos és Grid rendszerek © BME-IIT Sz.I. Desktop master startd schedd 2013.02.25. - 24 -
25.
Job indítás Schedd Startd Starter Shadow Submit Párhuzamos és Grid rendszerek © BME-IIT Sz.I. Customer Job Condor Syscall Lib 2013.02.25. - 25 -
26.
Condor flock Condor job-ok personal your Condor Pool workstation Condor "Barát" Condor Pool Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 26 -
27.
Milyen feladatok lehetnek ? • Els sorban hosszú futási idej , számításigényes feladatok. • Különböz univerzumok léteznek – – – – – Standard Vanilla MPI Grid Java Párhuzamos és Grid rendszerek © BME-IIT Sz.I. – – – – Scheduler Local Parallel VM 2013.02.25. - 27 -
28.
Standard univerzum • checkpointing, automatikus migráció • meglev programot újra kell fordítani, esetleg csak linkelni • az alkalmazás nem használhat bizonyos rendszerhívásokat: pl. fork, socket, alarm, mmap • („elkapja” a file m veleteket) Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 28 -
29.
Vanilla univerzum • nincs checkpointing, nincs migráció • meglev futtatható kódot nem kell vátoztatni • nincs korlátozás a rendszerhívásokkal szemben. • NFS, vagy AFS kell !!!! Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 29 -
30.
PVM univerzum • • • • • • MW jelleg PVM programok környezete Binárisan kompatibilis PVM 3.4.2 + taszk kezeléshez kieg. Dinamikus VM kialakítás. Heterogén környezet támogatása Egy user csak egy példányban futathat deamont Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 30 -
31.
Condor felépíti a virtuális gépet Master pmvd Slave pmvd PVM alkalmazás M S S #1 #2 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. S #3 S #4 S C #5 #6 2013.02.25. - 31 -
32.
MPI univerzum • • • • • • MPICH változtatás nélkül. Bináris kompatibilitás Csak ch_p4 device Dinamikusan nem változhat Nem állhat meg. NFS vagy AFS kell. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 32 -
33.
Futtatás lépései • A job összeállítása • Job bejelentése a Condor-nak • Job-ot a Condor futtatja az általa kiválasztott gép(eken), szükség esetén átmozgatja egy másik gépre. • Job befejez dik, a Condor e-mail-t küld a felhasználónak. Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 33 -
34.
Egy egyszer jobleíró universe = vanilla executable = mathematica input = in$(Process).dat output = out$(Process).dat queue 50 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 34 -
35.
Egy másik jobleíró universe = vanilla executable = /bin/hostname output = hostname.out.$(Process) error = hostname.err.$(Process) log = hostname.log queue 3 Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 35 -
36.
Sun Grid Engine (SGE) • • • • • • • A Condor-hoz hasonló ütemez . Queue-kat definiál. Hangsúlyos a terhelés kiegyensúlyozása. Backup master ütemez . Check-point. Migrálási lehet ség. Négy szerepkör: – master, submit, exec, admin, Párhuzamos és Grid rendszerek © BME-IIT Sz.I. 2013.02.25. - 36 -