Valid XHTML 1.0!


 

(last update 23. Sep 2000, additional remark at end)

auf Deutsch: eine Ehrenrettung für SETI@home

Meanwhile I have heard/read some critique about the SETI@home project of the famous Berkeley University, one of the absolute best of the world. Despite sometimes also justified statements are made in this regard, I think generally speaking these critics are mostly wrong. The reasons are listed below.

  • First despite some other Internet distributed computing projects are performed, no one has ever even approached the size of SETI@home regarding participating clients and bandwidth of the needed traffic to sustain the project (mainly the working data download, the results create mainly hits, but much less bandwidth due to their much lower size). These extraordinary, never before met demands surprised even the SUN people, who donated their most recent hardware along with direct support. They deliver the best UNIX servers around, but discover now new, unexpected limits... You can't blame the SETI@home project specialists for this! (sidestepping is possible, if you use several directories, so you can continue SETI crunching even for limited no connection times --- this I have done with great success so far)

  • The database systems of Informix (maybe Oracle or Sybase would perform a little better?) are also under a lot of pressure with such high numbers of insertions and queries (For example, do you not watch your progress in the statistics? I do daily!). Everybody, who knows enough about SQL RDBMSs, is aware of the difficulty, to keep response times reasonable under such conditions!

  • The network gets also a lot of pressure by the mentioned traffic --- and the network of Berkeley is not under the control of the SETI@home stuff, but they can't avoid to expose it to this high bandwidth of course. This creates another source for connection problems.

  • Another point is, that it is in large parts a project done with donations and without payment. The responsibles do this stuff in their spare time for many platforms, and this type is much better suited for any UNIX systems, regardless if it's the original Solaris environment, which is used by themselves, or LINUX, BSD, IRIX, AIX and so on. They had a hard time, to make the client software sufficient stable for the nasty, unreliable MS Windows environment, which is always like a black box and the connection software is also far too often a proprietary special variant of a more or less insane provider... They are simply neither able to support all of these due to their limited manpower, nor could they afford it for all.

  • And finally, due to my many years of software development experience I learned, that more or less tiny glitches in a software, which is still in development, can't be avoided at all time. Therefore you have to give them this fact to their favor. (A little piece of information: after about one year of participation I encountered in total four minus five counting errors of submitted results, nearly compensating each other, leaving the official value just one below the real number --- a minor, unimportant fault, compared to my approximately 1000 results so far.)

  • A minor concern is also sometimes heard or read: that work units are sometimes --- not often! --- sent more than once and it's sometimes assumed, that this is only to keep the project and the participating computers running. This isn't true: first, scientific projects like this need generally confirmation to exclude faulty hardware and software behaviour; only because they didn't expect the huge participation the Berkeley people didn't planned this more-than-once calculations origninally. And sometimes they had trouble to keep up with the demand of new work units because of the also unexpected bottleneck of data conversion from tapes into digital, downloadable data. But don't be afraid at all, the project is doing well and nothing is actually wasted.

Mittlerweile wurde einige Kritik an dem SETI@home-Projekt der berühmten Berkeley University laut, eine der absolut Besten weltweit. Obwohl diese Vorwürfe teils ein Körnchen Wahrheit beinhalten, sind sie im Großen und Ganzen unberechtigt. Die Gründe schildere ich im Folgenden.
  • Zunächst laufen noch ein paar andere Internet-Projekte mit verteilter Rechenzeit, von denen aber Keines auch nur annähernd die Größe von SETI@home erreicht hat bezüglich beteiligter Client-Installationen und Bandbreite, die zur Aufrechterhaltung des Projekt erforderlich ist (im Wesentlichen durch den work unit download, die viel kleineren Ergebnisdateien erzeugen hauptsächlich Anfragen, aber viel weniger Bandbreite. Diese außerordentlichen, beispiellosen Anforderungen haben sogar SUNs Mitarbeiter überrascht, die ihre modernste Hardware und direkten Support gratis zur Verfügung stellten. Sie liefern die besten UNIX Server auf dem Markt, aber mussten jetzt neue, unerwartete Grenzen entdecken... Dafür kann man die Macher des SETI@home-Projekts nicht verantwortlich machen! (Umgehen ist möglich, wenn man mehrere Verzeichnisse benutzt, so dass man das SETI@home-Rechnen für eine gewisse Zeit auch ohne gelungenen Verbindungsaufbau fort setzen kann --- das habe ich bisher mit einigem Erfolg getan)

  • Die Datenbanksoftware von Informix (evtl. würde es mit Oracle oder Sybase ein bisschen besser gehen?) wird enorm gefordert durch die vielen Ergänzungen und Abfragen (Z.B. holt man meist regelmäßig seine aktuelle Statistik ab, oder nicht? Ich mache das täglich!). Alle, die genug über SQL-RDBMS's wissen, sind sich der Schwierigkeit bewusst, die Antwortzeiten unter diesen Umständen erträglich zu halten!

  • Das Netzwerk steht ebenfalls durch die erwähnte Bandbreite gewaltig unter Druck --- und Berkeleys Netzwerk wird nicht von den Projektverantwortlichen betreut, so dass sie zwar die hohe Belastung nicht vermeiden können, aber dies erzeugt eine weitere Ursache für Zugriffs-/Verbindungsprobleme.

  • Ein weiterer Gesichtspunkt: es ist zur Hauptsache ein Projekt aus Spendengeldern und ohne Bezahlung. Die Verantwortlichen tun dies in ihrer Freizeit für viele Plattformen, und diese Software ist viel besser geeignet für irgend welche UNIX Systeme, egal ob es das originale Solaris ist, was sie selbst benutzen, oder LINUX, BSD, IRIX, AIX usw. Es war nicht leicht, die Client Software für das misratene und unzuverlässige MS Windows ausreichend stabil zu machen, das immer eine Art "Black Box" darstellt und die Verbindungssoftware ist allzu oft ein Eigenbau mehr oder weniger unvernünftiger Provider... Sie können schlicht nicht alle Diese unterstützen, erst recht nicht, wenn man ihre geringe Personalstärke berücksichtigt.

  • Und schließlich kann ich nach vielen Jahren Erfahrung in der Software- Entwicklung sagen, dass mehr oder weniger kleine Probleme in einer Software, die in Entwicklung befindlich ist, praktisch nicht immer verhindert werden können. Das muss man ihnen auch noch zugute halten. (Info am Rande: im Lauf der Zeit, nach ca. 1 Jahr Teilnahme, kam es zu insgesamt vier minus fünf Zählfehlern bei meinen Ergebnissen, d.h. effektiv wird ein Ergebnis weniger aus gewiesen, als tatsächlich übertragen wurde --- es hat sich also weit gehend ausgeglichen, bei ca. 900 Resultaten jedenfalls völlig unerheblich.)

  • Manchmal hört oder liest man auch eine weniger bedeutende Kritik: dass manchmal --- nicht oft! --- Dateneinheiten mehr als einmal an User geschickt werden und es wird teils angenommen, dass dies nur geschieht, um das Projekt und die teilnehmenden Computer zu beschäftigen. Das stimmt jedoch nicht: zunächst ist bei wissenschaftlichen Projekten dieser Art i.a. eine Bestätigung als Absicherung vor Hardware- und Software-Fehlern nötig; die Projektleute in Berkeley hatten die enorme Beteiligung an dem Projekt nicht erwartet und daher auf diese Zeit raubende Methode verzichen wollen und außerdem entpuppte sich zeitweise die Konvertierung von Banddaten in Download fähige digitale Daten als unerwarteter Engpass. Aber keine Sorge, das Projekt läuft gut und es geht nichts wirklich verloren.


 

back to SETI main  back to main

remarks etc. to: stefan.urbat@apastron.lb.shuttle.de

(URL:  http://www.lb.shuttle.de/apastron/setiDef.htm)