Honza píše:Carl vydal novou verzi CPDN cislovanou jako 5.15.
Mela by byt robusnejsi ve chvilych, kdy model padne (restart), osetrenejsi pripady, kdy dojde k rewindu o 1 den/mesic/rok) a bude umoznovat kratsi Coupled modely (80 nebo i jenom 40 let), o kterych jsem se jiz drive zminoval.
Novejsi aplikaci dostanete po dokonceni soucasnych vypoctu nebo pri padu modelu; kratsi modely az budou pripraveny.
Sqela zprava. Tak snad ubyde nedopocitanych modelu.
Jeste otazky: Jak se chova scheduler? Je natolik inteligentni, ze dava kratsi modely na slabsi stroje prip. na ty, ktery jedou BOINC jen zlomek dne? A co deadline u tech kratsich modelu?
Kratsi modely nejsou jeste pripravene; pripravena je na ne nova aplikace.
Narozdil od vetsiny projektu neni primitivni pripravit nove modely k pocitani - nejde o to proste jenom naporcovat nejaka "data" nebo zmenit jeden parametr.
Kratsi modely mohou vychazet z castecnych vysledku "dlouhych" modelu (tj. byt jejich pokracovanim), mohou byt delenim delsich modelu na mensi porce, muhou se odvozovat od speficickych pozadavku vyzkumniku (kombinace parametru v ramci soucasne studie, tedy nejaka parcialni zjisteni a jejich overene nebo dalsich studii).
Kazda volba ma sve dalsi konsekvence pro dalsi zpracovani, mozna pujde o jejich kombinaci...nevim.
Take je dosti pravdepodobne, ze bude venovana zvysena pozornost priprave novych modelu, aby nedoslo k nejake chybe ve vstupnich parametrech, jako se jiz jednou stalo.
Pekne, pekne.
Kvuli ruznym experimentum a presouvanim na jiny pocitac mi model trva trochu dele a jsem v nem o neco pozadu, ale Conroe to snad dozene - "pokud nespadne"...
Na tom PIII to nejspis jen odesila trickle. Pocitat se to bude nejspis na nejakym dualcore bez netu, soude podle trickles a trickles za 2 modely za mesic a pul.
To by PIII tezko zvladla, leda ze ji chladi k absolutni nule a zaktuje nekam nad 10GHz
Verze 5.15 je opravdu stabilni jak uz psal Honza.
Dnes mi kleknul disk na NFS serveru kdyz na nem bezelo 9WU. Uz jsem se s nima rozloucil, protoze BS u vsech hlasilo computation error. Nahodil jsem server a hle:
01/09/2006 06:23:07| |Can't get task disk usage: system opendir
01/09/2006 06:23:07| |Can't open temporary state file: client_state_next.xml system fopen
01/09/2006 06:23:07| |Couldn't write state file: system fopen
01/09/2006 07:43:10| |Can't get task disk usage: system opendir
01/09/2006 08:41:05|climateprediction.net|Task hadcm3lbm_blar_25310086_1 exited with zero status but no 'finished' file
01/09/2006 08:41:05|climateprediction.net|If this happens repeatedly you may need to reset the project.
01/09/2006 08:41:05| |Rescheduling CPU: application exited
01/09/2006 08:41:05|climateprediction.net|Restarting task hadcm3lbm_blar_25310086_1 using hadcm3lb version 515
01/09/2006 08:41:06|climateprediction.net|Task hadcm3lbm_c3s1_25334036_0 exited with zero status but no 'finished' file
01/09/2006 08:41:06|climateprediction.net|If this happens repeatedly you may need to reset the project.
01/09/2006 08:41:06| |Rescheduling CPU: application exited
01/09/2006 08:41:06|climateprediction.net|Restarting task hadcm3lbm_c3s1_25334036_0 using hadcm3lb version 515
Nasledoval restart vsech WU a pocita se dal !!!od posledniho checkpointu!!!. Tak myslim ze konecne rapidne ubyde nedopocitanych modelu!
Carl odvedl fakt sqelou praci. Tohle jsem necekal.
EDIT: Tak jsem to prechvalil. Prvni model z tech restartnutych spadnul po 3 hodinach pocitani. Takze 5.15 je znacne blbovzdorna, ale kazdou blbost jakou udelam nezkousne.
Diky za zpravu - svym zpusobem je dobre vedet, ze je 5.15 stabilnejsi nebo blbuvzdornejsi. Carl se na zkusenosti s 5.15 nedavno ptal...
Skoda, ze Carl asi bude koncem roku odchazet z CPDN - je to zkuseny a zapaleny programator, ktery je s projektem od jeho zacatku. Tezko za nej hledat odpovidajici nahradu...doufam, ze tim projekt nebude moc tratit. Trebas s nim jeste stacim skocit znovu na pivko...
2 Honza: Az se poslou trickle ze vsech restartlych modelu, tak to sem jeste napisu. zatim to vypada 4modely dal odesilaj trickle a 1 spadnul. To je imho sqelej vysledek.
Kdyby to Carla tajimalo, tak ten spadlej je tenhle.
Mimochodem predtim mi na tech 4 diskless Preslerech bezel E@H a pri restartu padal kazdy 2. WU!! Takze CPDN si nevede vubec spatne, az na vetsi traffic po ethernetu.