Российская команда распределенных вычислений Russia

Russia - Российская Команда Распределенных Вычислений
Авторизация
Логин

Пароль



Вы не зарегистрированы?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Навигация
Счётчики
Orphus
Просмотр темы
 Распечатать тему
Проект Collatz Conjecture
ChubICE
Особенности, настройка и решение возникающих проблем.
 
Grey
Странно, с 7970 у меня выхлоп получился вдвое меньше чем на Коллатце. Перепроверю себя...

Да, POEM хороший проект, там и догонять поменьше, но есть три НО:
1. в РОЕМ част дефицит заданий. Даже с батником можно нарваться на простой и не достичь желаемого места.
2. чтобы полностью реализовать потенциал карточки нужен полноценный PCI-e 3.0, что не у всех наших в наличии.
3. POEM довольно сильно грузит ЦП.

Посему я и предлагаю бросить все ГП на Коллатц, который этими недостатками не обладает. Правда у него есть другой недостаток - сильнее греет карточки Печальный
А свободные потоки ЦП можно и нужно будет загрузить счетом ЦП-проекта. Который надо бы выбрать...

Стоит выбрать не только ГП проект, но и ЦП. И навалиться на эту пару.

Что выбрать из ЦП?

ClimatPrediction - слишком длинные задания. 270 часов, если мне не изменяет память.

Optima заданий давно не дает.

Asteroids - на днях нас обошли норвежцы. Надо бы часть сил туда бросить, и вернуть себе 10-е место, но до SETI.USA 11M, и до них за месяц не дотянуться. Увы Печальный

Oproject - не считал. Считавшие пусть выскажутся.

Docking - много заданий, не очень хлебный, небольшими усилиями можем удержать позицию, но подняться выше там трудно.

Из перечисленных ЦП проектов мне больше всего POGS нравится - очень хлебный, заданий много. Наши его сейчас активно считают. _2e_ , больше 200K в сутки выдает...

P.S. А вызов в WCG давно принят. Плюс еще будет ноябрьский челендж в Прайме. Да еще с перекрытием во времени.
Изменил(а) Grey, 2013-10-31 03:57
 
Grey
Grey написал:
Странно, с 7970 у меня выхлоп получился вдвое меньше чем на Коллатце. Перепроверю себя...


Перепроверил. Стало еще страньше.

Способ 1-й - сравнение аналогичных компов из топа проектов:

Лучший комп с одной 7970 в Поеме RAC 1.06M - http://boinc.fzk....tid=165517
Лучший комп с одной 7970 в Коллатце RAC 1.052M -
- http://boinc.thes...tid=126422
Т.е. с одной карточкой выхлоп одинаковый.

Лучший комп с двумя 7970 в Поеме RAC 1.44M - http://boinc.fzk....tid=120410
Лучший комп с двумя 7970 в Коллатце RAC 2.55M -
- http://boinc.thes...tid=129942
Т.е. с двумя карточками выхлоп в Коллатце почти вдвое больше. Причина - в Поеме карточки сильно конкурируют по PCI-e, а в Коллатце они его почти не нагружают.

Способ второй - по данным своих компов.

Один и тот же комп (с одной 7970) у меня в Поеме (счет в 4 потока) дает 1.1М, а в Коллатце 1.3М
Другой комп (с двумя 7970) в Поеме RAC 1.6M, а в Коллатце 2.2М
Изменил(а) Grey, 2013-10-31 21:39
 
anfes
Grey, в поэме 7970 у меня дает 1.1-1.2М, правда иногда виснет комп. Возможно какая-то аппаратная проблема, после этого при перезагрузке иногда не видет 1 карту (в компьютере 2х7970). На коллатце зависаний вроде нет, но ни один мой компьютер не дает больше 800К.
Поэму считаю в 8 потоков GPU + 4 потока CPU, память 2133MHz, на CPU больше ничего не считаю. Коллатц считаю в 4 потока (0.2 CPU на поток).
Andrey Fesenko (anfes)
 
Grey
anfes, в Коллатце для 7970 надо записать в файл solo_collatz_4.07_windows_x86_64__opencl_ati_100.config (он изначально пустой):

verbose=1
items_per_kernel=22
kernels_per_reduction=9
threads=8
sleep=1
build_options=-Werror

app_config.xml использую такой:

<app_config>
<app>
<name>solo_collatz</name>
<max_concurrent>4</max_concurrent>
<gpu_versions>
<gpu_usage>0.5</gpu_usage>
<cpu_usage>0.5</cpu_usage>
</gpu_versions>
</app>
<app>
<name>collatz</name>
<max_concurrent>4</max_concurrent>
<gpu_versions>
<gpu_usage>0.5</gpu_usage>
<cpu_usage>0.5</cpu_usage>
</gpu_versions>
</app>
<app>
<name>mini_collatz</name>
<max_concurrent>4</max_concurrent>
<gpu_versions>
<gpu_usage>0.5</gpu_usage>
<cpu_usage>0.5</cpu_usage>
</gpu_versions>
</app>

</app_config>

Реально считаю лишь solo
Изменил(а) Grey, 2013-11-01 00:42
 
shar
Grey написал:

Да, POEM хороший проект, там и догонять поменьше, но есть три НО:
1. в РОЕМ част дефицит заданий. Даже с батником можно нарваться на простой и не достичь желаемого места.
2. чтобы полностью реализовать потенциал карточки нужен полноценный PCI-e 3.0, что не у всех наших в наличии.
3. POEM довольно сильно грузит ЦП.


Пока задания есть, можно нахватать. Полноценный PCI-e 3.0 критичен для ATI. Nvidia относится к этому спокойнее. GTX650 1 поток 197K/сутки, 2 потока - 340, 3 - 383. И это на PCIe 1.0. POEMу нравятся зеленые 6-й серии, 5-я чуть ли не вдвое медленнее. Но вот ЦПУ проект любит - одно физ. ядро на проект приветствуется..

Что выбрать из ЦП?

ClimatPrediction - слишком длинные задания. 270 часов, если мне не изменяет память.


Длинные, есть и в разы длиннее. Но результаты периодически отсылаются и очки начисляются порциями.

Asteroids - на днях нас обошли норвежцы. Надо бы часть сил туда бросить, и вернуть себе 10-е место, но до SETI.USA 11M, и до них за месяц не дотянуться. Увы Печальный


Зато малой кровью очко выцарапывается.

Oproject - не считал. Считавшие пусть выскажутся.


Из необычного только возможность получать NCI-задания.

Из перечисленных ЦП проектов мне больше всего POGS нравится - очень хлебный, заданий много. Наши его сейчас активно считают. _2e_ , больше 200K в сутки выдает...


Его?

P.S. А вызов в WCG давно принят. Плюс еще будет ноябрьский челендж в Прайме. Да еще с перекрытием во времени.


А где инфо? Чего-то на BS не нашел.
 
shar
Grey написал:

Т.е. с одной карточкой выхлоп одинаковый.

Лучший комп с двумя 7970 в Поеме RAC 1.44M - http://boinc.fzk....tid=120410
Лучший комп с двумя 7970 в Коллатце RAC 2.55M -
- http://boinc.thes...tid=129942
Т.е. с двумя карточками выхлоп в Коллатце почти вдвое больше. Причина - в Поеме карточки сильно конкурируют по PCI-e, а в Коллатце они его почти не нагружают.


Есть подозрение, что затык не в PCIe, а в ЦПУ. Ну а карточки в коллатце стопудово разогнаны.


Способ второй - по данным своих компов.

Один и тот же комп (с одной 7970) у меня в Поеме (счет в 4 потока) дает 1.1М, а в Коллатце 1.3М
Другой комп (с двумя 7970) в Поеме RAC 1.6M, а в Коллатце 2.2М


Ну значит одну карту нагружать нужно поемой, другую коллатцем Подмигивание
 
Grey
shar, пока перебросил большую часть ЦП на Астероиды (немножко оставил в Docking), когда вернем очко и немного оторвемся, уравновесим скорость с норвежцами и освободившиеся ЦП перебросим на POGS. Там все будет определяться нашими ЦП-монстрами.

Russia в списке участников на WCG - http://www.worldc...ngeId=6195
 
Grey
shar написал:
Ну значит одну карту нагружать нужно поемой, другую коллатцем Подмигивание

Думал о таком, но не пробовал. Пробовал, играясь с app_config, отдавать большую часть карты под Поем, а остаток под Коллатц. Увы, заметного эффекта не наблюдал.
 
shar
Grey написал:

anfes, в Коллатце для 7970 надо записать в файл solo_collatz_4.07_windows_x86_64__opencl_ati_100.config (он изначально пустой):

verbose=1
items_per_kernel=22
kernels_per_reduction=9
threads=8
sleep=1
build_options=-Werror

app_config.xml использую такой:
......

<gpu_usage>0.5</gpu_usage>

А в 2 потока зачем? Коллатц и в один поток загружает карточку по полной. kernels_per_reduction=10, а sleep=0. Если будет вылетать с ошибкой, то items_per_kernel уменьшить на 1-ку. Ну и память тормознуть для снижения температуры...
Изменил(а) shar, 2013-11-01 01:04
 
Grey
shar написал:
А в 2 потока зачем? Коллатц и в один поток загружает карточку по полной. kernels_per_reduction=10, а sleep=0. Если будет вылетать с ошибкой, то items_per_kernel уменьшить на 1-ку. Ну и память тормознуть для снижения температуры...

В один поток карточка на уровне 85-90% грузится, а в два 90-99%. В два потока RAC получается на 5-10% выше.
А с параметрами еще поиграюсь, может и получится еще шустрее считать. Идея интересная, особенно с памятью. Спасибо!
 
anfes
shar, а на GTX570 (Ubuntu 13.10 x86_64) какие параметры для Collatz посоветуешь? Сейчас дает порядка 400К в сутки...
Andrey Fesenko (anfes)
 
Grey
Сегодня обнаружил что на паре машинок задания считаются в 3 раза дольше нормы. Причина - хотя компы работают под Win7/64, проект подгрузил на них сразу два приложения - 64 бит и 32 бит:
solo_collatz_4.07_windows_x86_64.... exe
и solo_collatz_4.07_windows_intexl86... exe
На втором, которое медленнее, задачки и считались.
Пока вылечил переустановкой проекта, хотя надо бы на app_info переходить, во избежание повторения ситуации.
 
shar
anfes написал:

shar, а на GTX570 (Ubuntu 13.10 x86_64) какие параметры для Collatz посоветуешь? Сейчас дает порядка 400К в сутки...

Для 550Ti
items_per_kernel=21
threads=8
kernels_per_reduction=9

Но это примерно. Инструкция по ускорению поиска ключей
1. качаем файл https://dl.dropbo...colfnd.rar
2. Разархивируем. Кидаем в папки 1,2 и 3 приложение collatz (предварительно переименовав в test.exe) с необходимыми dll.
3. Выгружаем boinc
4. запускаем в папке 1 s.bat. Ждем. Смотрим созданный log и выбираем наилучший items_per_kernel (скорее всего будет 21). Значение 22 опционально, не все карты его переносят.
5. правим значения items_per_kernel в файлах cc1 или cc2 в папках 2 и 3
6. запускаем в папке 2 s.bat. Ждем. Смотрим созданный log и выбираем наилучший kernels_per_reduction
7. правим значения kernels_per_reduction в файлах cc1 или cc2 в папках 1 и 3
8. Аналогично в папке 3 ищем threads и правим его значения
9. Можно повторить п.4 - п.8

Не проверял, но должно работать. В корне точно работоспособный вариант. Для линукса нужно будет переделать - батники простые, идея лежит на поверхности
Изменил(а) shar, 2013-11-01 16:02
 
shar
Grey написал:
solo_collatz_4.07_windows_x86_64.... exe
и solo_collatz_4.07_windows_intexl86... exe
На втором, которое медленнее, задачки и считались.
Пока вылечил переустановкой проекта, хотя надо бы на app_info переходить, во избежание повторения ситуации.


Сравнивал, 32х и 64х битные с одинаковой скоростью работают. Но имена конфигов у них разные Пока
 
Grey
Следуя мудрым советам shar, пооптимизировал настройки. Вот что получилось:

Для gtx560Ti:

items_per_kernel=21
kernels_per_reduction=8
threads=8
sleep=0
build_options=-Werror

Для gtx660Ti (чуть лучше чем оптимальные настройки gtx560ti):

items_per_kernel=19
kernels_per_reduction=10
threads=7
sleep=0
build_options=-Werror

Для HD7970:

items_per_kernel=22
kernels_per_reduction=9
threads=10
sleep=0
build_options=-Werror

Считаю только solo с app_config.xml
<app_config>
<app>
<name>solo_collatz</name>
<max_concurrent>4</max_concurrent>
<gpu_versions>
<gpu_usage>1.0</gpu_usage>
<cpu_usage>0.5</cpu_usage>
</gpu_versions>
</app>
</app_config>
 
Kess
Орлы!
У нас месячник в Коллаце. Вытащим "Россию" в Формуле Боинк и разогреем железо к зимним битвам.

Предлагаю здесь поделиться настройками конфигов под разные карты.
 
anfes
Kess написал:

Орлы!
У нас месячник в Коллаце. Вытащим "Россию" в Формуле Боинк и разогреем железо к зимним битвам.

Предлагаю здесь поделиться настройками конфигов под разные карты.

Надо попросить модераторов перенести сюда сообщения из этой темы
Andrey Fesenko (anfes)
 
ChubICE
anfes, перенес.
Keep on Crunching!

Бываю несколько раз в год, занялся учебой по новой профессии, если нужен пишите в ЛС (или через форму Обратной связи слева)
 
Kess
Потихоньку прибавляемУсмехающийсяance:
Пришлось переставить БОИНК на лучшей машинке - не хотел видеть новый конфиг в коллаце. Причина - накатил весной новую версию боинка поверх старой. Впопыхах пентатлона все работало нормально в Энштейне. А сейчас в Коллаце заглючило. День бился с настройками - ничего не помогало. Вспомнил 2011 год - снес все директории подчистую - переустановил - и все заработало.
Изменил(а) Kess, 2013-11-06 14:36
 
Перейти на форум: