homecluster писал(а):Если предположить что есть желающие купить персональный суперкомпьютер и купить ОС к нему с вариантами загрузок и предустановленным софтом то почему нужно называть таких покупателей "дураками". Может купить персональный суперкомпьютер для них мечта детства.
Производительность элементарных современных настольных компьютеров и так уже настолько высокая, что и она уже
не нужна массовому потребителю ... а производители железок "из кожи вон" лезут, чтобы
придумать чем ещё занять эту производительность и такие объёмы памяти - большинство
потребностей пользователя компьютера
"дутые", надуманные теми же производителями чтобы "впарить" потребителю ещё новую модель, они естественной потребностью не являются...
В этом смысле и совершенно естественным становится, что мэйнстримом в IT является не желание
объединить вычислительные мощности нескольких процессоров, а, напротив, на одном процессоре
разделить его мощность между разными потребностями - откуда и такой динамичный всплеск в развитии техник виртуализации, когда на одном процессоре создаётся несколько совершенно разнородных и разобщённых компьютеров ... процесс в точности до наоборот

.
homecluster писал(а):Меня тема персонального суперкомпьютера интересует также в плане объединения вычислительных нодов быстрой шиной обмена.
А если уже кому ... в исключительном порядке

недостаёт существующих мощностей, то...
Я уже писал в другом месте (
параллельность + синхронизации (примеры)), но здесь специально повторюсь:
... на сегодня есть 3 способа получить суперпроизводительность чуть ли не на бытовых компонентах, это:
1. использование
сильносвязанных многопроцессорных систем, с общей памятью RAM, а реально - это SMP
многоядерные реализации ... на сегодня совершенно не редкость архитектура с 2-мя процессорами по 4 ядра каждый;
2. использование
слабосвязных многопроцессорных систем, когда прцессоры (хосты) связаны высокоскоростными каналами связи (на сегодня 1Gb/s или даже 10Gb/s это не такая уже экзотика);
3. специальные мультипроцессорные вычислители ... но из которых (не считая всяческих экспериментальных штучек) реально к использованию пригодны только вычислители на графических процессорах (GPU) NVIDIA или ATI, см.
NVIDIA & CUDA (
это технологии очень новые).
Из них
самым дешёвым и самым производительным будет способ 3, а большинство задач, которые могут быть параллельно запрограммированы для кластеров, могут быть запрограммированы и для этого способа. Цена решения здесь $100 ... 200 ... 300 за графический вычислитель - это вместо стоимости N процессорных плат для кластера.
А самый
перспективный способ - №1! Потому, что для него не нужно специальных способов программирования, здесь достаточно использования стандартных POSIX потоков, семейства pthread_*(), и это сможет любой студент-недоучка ... а в способах 2 & 3 - это исключительно
индивидуальное программирование каждой задачи, и на диких диалектах языков программирования (MPI и CUDA, соответственно).
И из всего этого должно уже стать понятно, что из всех этих 3-х направлений кластерный как-раз - самый "отстойный", и именно потому к нему ослабевает интерес, и там очень прохладное развитие в последние лет 5-7.