Diky za pripomenuti a pokusim se to vysvetlit a dohnat.
O problemech databaze jsem informaval pred 2 tydny
zde.
Popis problemu:
V podstate problem zacal tim, ze 120GB database zaplnila cely disk a nebylo kam zapisovat dalsi zaznamy. Uzivatel to na prvni pohled mohl poznat podle toho, ze se mu nezaznamenavali trickle.
Aby toho nebylo malo, objevila se chyba ve scheduleru, kdy misto vraceni chybove hlasky doslo k tomu, ze byl model omylem zaslan k vypoctu jeste dalsimu uzivateli, resp hostu.
Pokud pocitaji stejny model dve masiny, jedna momentalne nedostane kredit; teoreticky to lze v budoucnu opravit a kredit na zaklade odesilanych tricklu dopocitat. Dulezite je, ze pro vedecke ucely jsou podstatne uploadovane vysledky. Jenze zatim nevime, co na to upload server - druhy upload muze prepsat prvni, byt odmitnut... Pokud budou duplicitne, lze to pouzit i jako kontrolu konzistence vysledku. Tedy chybu lze i konstruktivne vyuzit.
Celou kauzu jsem v te dobe dal moc nerozvadel a nespekuloval, protoze byl Tolu na dovolene a Carl na dalku udelal s databazi co slo.
Zjistit, zda-li se vas problem tyka:
Problem se tyka potencionalne kazdeho ucastnika CPDN, ale je treba to overit.
V podstate jde o to porovnat dva seznamy modelu:
a) modely, ktere mate pod svym
accountem v ramci
kazdeho pocitace a
b) modely, ktere mate na pocitacit ve Work tab (velmi dobrou pomuckou je
BoincView.
S nejvyssi pravdepodobnosti se jedna pouze o modely pridelene od pocatu Dubna a behem Kvetna.
Pripad I.
Pokud najdete na na svych masina (seznam b) modely, ktere nejsou na vasem uctu (seznam a), napiste hostID dane masiny, jmeno modelu (takove to 2uc9_300153972) a pripadne jak daleko mate model rozpocitany. Pokud uz probehl trickle, objevi se i na vasem seznamu tricklu v accountu a muzete tedy napsat i resultID. ResultID pomuze ke snadnemu zjisteni, kteremu hostu byl jeste bysledek zaslan.
Pripad II.
Pokud se na seznamu a objevi model, ktery se nenachazi ve vasem pocitaci (je na seznamu a, ale ne b), tak si tim nelamte hlavu. Pripadne reportujte stav, kdy u dane WU byla udelana nejaka prace, ale ne z vaseho pocitace.
Co delat:
Pripad I - pokud mate z daneho modelu spocitano jen par hodin, muzete dat abort daneho modelu. Pokud uz mate rozpocitano vice, dejte prozatim suspend, nez se problem mozna vyresi na strane serveru.
Davat reset bych nedoporucoval - ztratite nejen rozpocitanou praci CPDN, ale i pripadne vsechny dalsi modely, ktere byly spravne prideleny k pocitani.
Moje zkusenost:
Pokud jsem to neprehledl, tak moje tri masiny pocitajici CPDN nemely zadny spatne prideleny model. Asi mi take pomohlo dat "No more work" nebo disable Network access.
Nejstarsi spatne prideleny model je nekdy zacatkem Dubna, takze vice nazpatek neni treba hledat.
Update:
bude nasledovat, az nastuduji aktualni stav.
OK, nejlepsi je asi odkaz na soucasny thread na CPDN/BOINC foru
zde. Obsahuje i reakci a vysvetleni kolegy moderatora (crandles) na 'boshuv navrh na prosty reset projektu. "The last suggestion is very messy...".
Kdyz bude neco nejasne ci zmatene, klidne se ptejte.