Як співвідносяться уніфіковані шейдери на NVIDIA i ATi?

Автор RIPLEY, 10 Березень 2009, 02:20:27

Попередня тема - Наступна тема

RIPLEY

Вже давно цікавить таке питання: як можна порівняти кількість уніфікованих шейдерів на відеокартах від ATi та NVIDIA? Адже виглядає дуже дивним ситуація, коли, наприклад, Radeon HD 3850 з 320 уніфікованими щейдерами, програє по всім фронтам GeForce 9800GT з його 112 "самі знаєте чого". А коли читаєш тех. характеристики HD 4870, то страшно стає - 800!!! шейдерних процесорів. Мати рідна! Той же флагман від NVIDIA GTX280 має майже в три рази менше unified shaders, хоча по рівню продуктивності не пасе задніх...

Невже ATi чисто в маркетингових цілях показує такі нереальні цифри по кількості унфікованих шейдерів в своїх продуктах? І чи існує якась формула, яка дасть можливість порівняти шейдерну силу двох конкурентів, наприклад, щось по типу 320 шейдерів ATi відповідають 64 від NVIDIA?
Intel Core i5 4670 @3,8GHz, MSI Z87 G45 Gaming, Kingston HyperX Savage DDR3 1600 16Gb, MSI RTX3060 VENTUS 12G OC, HDD Samsung 502IJ F1, SeaSonic-X650 (650 Вт), Asus Vento A8, Xbox360 Controller // NES, Sega MasterSystem, Sega MegaDrive 2, Sony PlayStation, Sega Dreamcast, Sony PlayStation 2 // Sony Xperia 10 IV

linuxdrom

Цитата: RIPLEY від 10 Березень 2009, 02:20:27
Вже давно цікавить таке питання: як можна порівняти кількість уніфікованих шейдерів на відеокартах від ATi та NVIDIA?
ніяк
Цитата: RIPLEY від 10 Березень 2009, 02:20:27
Невже ATi чисто в маркетингових цілях показує такі нереальні цифри по кількості унфікованих шейдерів в своїх продуктах?
ні
Цитата: RIPLEY від 10 Березень 2009, 02:20:27
І чи існує якась формула, яка дасть можливість порівняти шейдерну силу двох конкурентів, наприклад, щось по типу 320 шейдерів ATi відповідають 64 від NVIDIA?
ні

Edd.Dragon

Цитата: RIPLEY від 10 Березень 2009, 02:20:27І чи існує якась формула, яка дасть можливість порівняти шейдерну силу двох конкурентів
Существует вполне определенное и единственно примитивно сравнимое понятие - флопсы (флоат оперейшнс пер секонд), которое применимо к любому процессору. Это так сказать - кол-во виртуальных лошадок под капотом. Но опять таки, разные процы с разными задачами используют этих лошадок с разной эффективностью. Ну и кол-во транзисторов в чипе, что тоже не говорит об уровне производительности.

Например ATI перевалила за 1 терафлопс. Но при этом обычно nVidia необходимо для достижения аналогичной производительности несколько меньше. Хотя в некоторых играх - наоборот.

Так что...

l1nk

Мож, я че-то путаю, но по-моему унифицированные процессоры АТИ могут выполнять 5 операций (каких-не скажу!), так что вот: у моей 3870-64 процессора,которые множим на эти самые 5 операций и получаем обещанные 320.
Сразу сорри, если не прав.
If I had a second chance, I'd make amends
Only to find myself losing in the end

linuxdrom

Цитата: l1nk від 10 Березень 2009, 14:22:01
Мож, я че-то путаю, но по-моему унифицированные процессоры АТИ могут выполнять 5 операций (каких-не скажу!), так что вот: у моей 3870-64 процессора,которые множим на эти самые 5 операций и получаем обещанные 320.
Сразу сорри, если не прав.
Ну все немного не так.
Скалярных унифицированных процессоров там 320. Однако они объедены в "группы" по 5 шт. Вот такая "группа", состоящая из 5 ALU (один из которых модный  :)) и блока ветвлений является  суперскалярным унифицированным процессором, и их действительно 64  :)
Цитата: l1nk від 10 Березень 2009, 14:22:01
унифицированные процессоры АТИ могут выполнять 5 операций (каких-не скажу!)
суперскалярный может выполнить 5 MAD инструкций, а "модный"  ALU может, вместо MAD, одну одну сложную - COS, EXP, LOG, SIN...

S!N

По-моему тут проявляется влияние AMD c ее рейтингами у процессоров, которые еще начались с Athlon XP и продолжились в Х2, никто же не скажет, что Athlon X2 6000 работает на 6 ГГц. И что самое интересное, на коробках и в мануалах нигде не пишется про объединенные группы, а указывается именно это нереально огромное количество унифицированных процессоров, и я думаю это сделано умышленно в маркетинговых целях (неполнота информации, а не сама архитектура, конечно)
Цитата: linuxdrom від 10 Березень 2009, 15:24:55SIN...
Да, слушаю=)
High tech. Low life.

Edd.Dragon

Цитата: SiN від 10 Березень 2009, 16:47:40И что самое интересное, на коробках и в мануалах нигде не пишется про объединенные группы, а указывается именно это нереально огромное количество унифицированных процессоров
Проблема в том, что пользователи понимают слово "процессор" слишком узко. Хотя на самом деле CPU\GPU - это буквально в переводе "центральный\графический процессорный модуль". А процессор - это нечто, выполняющее процесс. Потому процессором можно назвать как весь чип, так и его блоки, способные что-то независимо обрабатывать.

Точно так же nVidia не пишет, что ее 160 блоков объединены в 10 кластеров. Естественно, что в целях привлечения внимания лучше называть наибольшие цифры, касающиеся самого нижнего уровня. Но на самом деле получается, что скалярных блоков столько то, они объединены в столько то суперскалярных блоков, которые объединены в столько кластеров, которые в одном чипе. Тип того. Но кому это интересно?! )))))))


DEAD_RAT

Цитата: edd_k від 10 Березень 2009, 18:28:56
Но кому это интересно?! )))))))
Например мне.
Я сильно офигел, когда народ начал подсчитывать количество процессоров в 7600 и 8600.
Оказалось 17 против 32. 8600 оказалась вдвое производительнее ;D.

S!N

Цитата: DEAD_RAT від 10 Березень 2009, 19:11:29Оказалось 17 против 32. 8600 оказалась вдвое производительнее .
А разве не так?

7600 GS - 8600 GT
7600 GT - 8600 GTS

Как раз у них разрыв в 2 раза, во всяком случае если судить по Марку.
High tech. Low life.

finalplayer

Цитата: SiN від 10 Березень 2009, 20:04:59
А разве не так?

7600 GS - 8600 GT
7600 GT - 8600 GTS

Как раз у них разрыв в 2 раза, во всяком случае если судить по Марку.


Точные цифры я не помню(лень перерывать стопку ДПК), но вроде правда: в тесте 3Д МАРК 8600 ГТ вдвое производительнее 7600 ГС.

DEAD_RAT

Цитата: finalplayer від 10 Березень 2009, 21:45:28
Точные цифры я не помню(лень перерывать стопку ДПК), но вроде правда: в тесте 3Д МАРК 8600 ГТ вдвое производительнее 7600 ГС.
Это только в Марке а реально 7600GT и 8600GT практически равны. ;)
Что-то мы с темы съехали.

RIPLEY

#11
Цитата: l1nk від 10 Березень 2009, 14:22:01
у моей 3870-64 процессора,


Ну от,  аналог від НВІДІА з рівною продуктивністю буде 9600GT - він теж має 64 уніфіковані шейдерні процесори.

Тобто якщо розгядати топовий на даний час Радеон HD4870 з його 800 шейдерами, по розрахункам nVIDIA він має 160 Unifien Shaders (800*64/320). 
А в топовому GeForce GTX280 їх аж 240  :D
Intel Core i5 4670 @3,8GHz, MSI Z87 G45 Gaming, Kingston HyperX Savage DDR3 1600 16Gb, MSI RTX3060 VENTUS 12G OC, HDD Samsung 502IJ F1, SeaSonic-X650 (650 Вт), Asus Vento A8, Xbox360 Controller // NES, Sega MasterSystem, Sega MegaDrive 2, Sony PlayStation, Sega Dreamcast, Sony PlayStation 2 // Sony Xperia 10 IV

Edd.Dragon

А частоты ты учел?

Например у 9600 частота шейдеров куда повыше чем у 3870. А уже в нынешнем поколении и архитектуры больше похожи стали, и разница частот другая.

А тот факт, что fps-ы далеко не только от кол-ва и производительности зависят - где учтен?

А влияние памяти, ее частоты, разрядности?

:D

linuxdrom

Цитата: RIPLEY від 10 Березень 2009, 23:34:43по розрахункам nVIDIA він має 160 Unifien Shaders (800*64/320).
це ще що за лол?

Цитата: edd_k від 10 Березень 2009, 23:38:55
А частоты ты учел?
а зачем? Пацаны хотят чисто конкретно простую формулу типа 800*64/320, и не к чему заморачиваться такими глупостями  :D

DEAD_RAT

Цитата: linuxdrom від 12 Березень 2009, 02:06:15
Пацаны хотят чисто конкретно простую формулу типа 800*64/320, и не к чему заморачиваться такими глупостями  :D
Ща попробую :D

Х1 = К * Х2

Где Х1 - производительность первой карты, Х2-второй.
К - это коэффициент от нуля до бесконечности(определяется экспериментально для каждой игры и каждой карты). :)

Edd.Dragon

#15
Ни разу ты не математик

Надо хотя бы так:

Х1 = f(k1, ...., kn) * Х2

где f - n-мерная функция зависимости (в разрезе карт, игр, процессоров, кол-ва памяти - всего n параметров)

rayven

 :D
Цитата: linuxdrom від 12 Березень 2009, 02:06:15а зачем? Пацаны хотят чисто конкретно простую формулу типа 800*64/320, и не к чему заморачиваться такими глупостями   :D
Решили сравнить две архитектуры..


*молиться о том, чтоб никто не начал сравнивать соотношение функциональных блоков и количество транзисторов в процессорах*
Хто хоче шукає можливості. Хто не хоче, шукає виправдання

DEAD_RAT

Цитата: edd_k від 12 Березень 2009, 15:56:06
Ни разу ты не математик
Я не математик - я физик, а в физике принято испольовать максимально простые функциии. :P

RIPLEY

#18
Перепрошую за "самопроизвол", але якщо рахувати, що теоретично відеокарта від АТі з 320 Unified shaders (далі US), по швидкодії відповідає Жирафу з 64 US, то звідси можна вивести формулу з одним невідомим X. Наприклад, щоб взнати скільки US має HD4870 по міркам NVIDIA, вичисляєм рівняння: 320 - 64, а 800 - X. Ось звідки я взяв цифру 160 US.

Питання це виникло у мене після того, як мій знайомий, ярий фанат марки Радеон, постійно нагружає мене доріканнями, що його HD 3870 з 320 уніфікованими конвеєрами, в два рази продуктивніша, ніж моя GF 9800GT (112 US) ;D  І ніякі тести та рецензії не можуть втихомирити цього "безумця". От я і вирішив розяснити для себе як теперішнє покоління відеокарт співвідносить кількість уніфікованих шейдерних процесорів. Бо ж раніше було все просто radeon 9800 Pro мав 8 піксельних 3 вертексних, те саме було у тогочасного конкурента від NVIDIA - FX 5900. Потім були X800 і GeForce 6800 з 16 піксельними і 5 вертексними. А тепер...фіг тепер поймеш їхні маркетингові трюки з шейдерами  :(
Intel Core i5 4670 @3,8GHz, MSI Z87 G45 Gaming, Kingston HyperX Savage DDR3 1600 16Gb, MSI RTX3060 VENTUS 12G OC, HDD Samsung 502IJ F1, SeaSonic-X650 (650 Вт), Asus Vento A8, Xbox360 Controller // NES, Sega MasterSystem, Sega MegaDrive 2, Sony PlayStation, Sega Dreamcast, Sony PlayStation 2 // Sony Xperia 10 IV

Edd.Dragon

Цитата: RIPLEY від 15 Березень 2009, 01:09:23Перепрошую за "самопроизвол", але якщо рахувати, що теоретично відеокарта від АТі з 320 Unified shaders (далі US), по швидкодії відповідає Жирафу з 64 US, то звідси можна вивести формулу з одним невідомим X
Тоже извиняюсь и повторюсь: а частоты что, увсех моделей одинаковы и меняется только кол-во шейдеров? (За влияние разрядности шины и частоты памяти даже переспрашивать не буду). В итоге твоя формула применима только для этих двух карт. Ну может еще для 1-2 залетных ))

RIPLEY

#20
Цитата: edd_k від 15 Березень 2009, 01:31:11
а частоты что, увсех моделей одинаковы?


А до чого тут частоти?  ??? Частоти можуть бути різні, але рівень швидкодії і кількості FPS однаковий. Якщо так ставити питання, то тоді взагалі неможливо порівняти жодну карту в яких частоти не збігаються. Хоч в GTX260  і HD4870 частоти ГП і пам'яті різні, їх всерівно порівнюють і ставлять приблизно на одному рівні по швидкості. Але чому ATi пише, що її карта має 800 US, а у nVIDIA тільки 192 (55нм 216)?

Так виглядає, що Радеон повинен мати в 3 рази більше уніфікованих шейдерів, ніж ДжеФорс, що показувати одинаковий рівень швидкодії.
Intel Core i5 4670 @3,8GHz, MSI Z87 G45 Gaming, Kingston HyperX Savage DDR3 1600 16Gb, MSI RTX3060 VENTUS 12G OC, HDD Samsung 502IJ F1, SeaSonic-X650 (650 Вт), Asus Vento A8, Xbox360 Controller // NES, Sega MasterSystem, Sega MegaDrive 2, Sony PlayStation, Sega Dreamcast, Sony PlayStation 2 // Sony Xperia 10 IV

linuxdrom

Цитата: RIPLEY від 15 Березень 2009, 16:15:19
А до чого тут частоти?  ??? Частоти можуть бути різні, але рівень швидкодії і кількості FPS однаковий. Якщо так ставити питання, то тоді взагалі неможливо порівняти жодну карту в яких частоти не збігаються. Хоч в GTX260  і HD4870 частоти ГП і пам'яті різні, їх всерівно порівнюють і ставлять приблизно на одному рівні по швидкості. Але чому ATi пише, що її карта має 800 US, а у nVIDIA тільки 192 (55нм 216)?

Так виглядає, що Радеон повинен мати в 3 рази більше уніфікованих шейдерів, ніж ДжеФорс, що показувати одинаковий рівень швидкодії.
ти знущаєшся?  :-\

DEAD_RAT

Цитата: RIPLEY від 15 Березень 2009, 16:15:19
А до чого тут частоти? 
Ну а чем кроме частот отличаются 4870/4850 8800GTS/9800GTX/GTX+

Но понимаешь, сравнивать как ты - это сравнивать машины по объему движка.

graved1gger

Цитата: linuxdrom від 15 Березень 2009, 16:28:16
ти знущаєшся?  :-\
это второй дубль эпопеи про кривые дрова ))))

RIPLEY, сорри, я не выдержал=))))
this gravedigga is completely broken. all we want is an old version of that toxic angry guy who hates everything and everyone © link. А вот я не уверен,  что старая версия будет доступна.

RIPLEY

Ех, злі ви якісь, іду я від вас   ;)
А я тільки хотів зрозуміти чому така велика різниця в кількості шейдерів між рівноцінними картами конкурентів...
Ладно, тему закриваю через відсутність матеріалу для дискусії.
Intel Core i5 4670 @3,8GHz, MSI Z87 G45 Gaming, Kingston HyperX Savage DDR3 1600 16Gb, MSI RTX3060 VENTUS 12G OC, HDD Samsung 502IJ F1, SeaSonic-X650 (650 Вт), Asus Vento A8, Xbox360 Controller // NES, Sega MasterSystem, Sega MegaDrive 2, Sony PlayStation, Sega Dreamcast, Sony PlayStation 2 // Sony Xperia 10 IV

graved1gger

Цитата: RIPLEY від 15 Березень 2009, 22:36:19
Ех, злі ви якісь, іду я від вас   ;)
А я тільки хотів зрозуміти чому така велика різниця в кількості шейдерів між рівноцінними картами конкурентів...
Ладно, тему закриваю через відсутність матеріалу для дискусії.
блин, тут было хорошее сравнение с машинами, а вообще две разные технологии и никак ты их не сравнишь
this gravedigga is completely broken. all we want is an old version of that toxic angry guy who hates everything and everyone © link. А вот я не уверен,  что старая версия будет доступна.

Edd.Dragon

Цитата: RIPLEY від 15 Березень 2009, 16:15:19Частоти можуть бути різні, але рівень швидкодії і кількості FPS однаковий.
Т.е. по-твоему получается так:

берем карту ATI у которой 200 процессоров на частоте 1000 и карту nVidia, у которой 50 процессоров на частоте 1500. Они имеют одинаковую производительность, следовательно получаем, что кол-во процессоров мы сравниваем как 4:1 (забив на частоты).

Теперь берем другую пару карт ATI и nVidia. У которых 300 и 75 процессоров соответсвенно (4:1), но на обоих картах они работают на частоте 1000. И ты хочешь сказать, что все-равно будет 4:1 независимо от частоты, от которой производительность зависит так же как и от кол-ва блоков?

RIPLEY

edd_k, тобто ви хочете сказати, що карти від nVIDIA за рахунок високих частот шейдерного блоку показують рівні результати з картами ATi у яких в три рази більше тих самих шейдерів?
Intel Core i5 4670 @3,8GHz, MSI Z87 G45 Gaming, Kingston HyperX Savage DDR3 1600 16Gb, MSI RTX3060 VENTUS 12G OC, HDD Samsung 502IJ F1, SeaSonic-X650 (650 Вт), Asus Vento A8, Xbox360 Controller // NES, Sega MasterSystem, Sega MegaDrive 2, Sony PlayStation, Sega Dreamcast, Sony PlayStation 2 // Sony Xperia 10 IV

DEAD_RAT

Цитата: RIPLEY від 16 Березень 2009, 22:53:50
edd_k, тобто ви хочете сказати, що карти від nVIDIA за рахунок високих частот шейдерного блоку показують рівні результати з картами ATi у яких в три рази більше тих самих шейдерів?
Нет, а то что у них совершеннно всё по-разному. А частота шейдеров - это одна из особенностей, которая конечно отчасти компенсирует их меньшее количество

Edd.Dragon

Цитата: RIPLEY від 16 Березень 2009, 22:53:50
edd_k, тобто ви хочете сказати, що карти від nVIDIA за рахунок високих частот шейдерного блоку показують рівні результати з картами ATi у яких в три рази більше тих самих шейдерів?
Нет, я хочу сказать, что фраза "у яких в три рази більше тих самих шейдерів" - ошибочна )))

DEAD_RAT

Цитата: edd_k від 17 Березень 2009, 13:32:29
Нет, я хочу сказать, что фраза "у яких в три рази більше тих самих шейдерів" - ошибочна )))
Извини, я тебя не так понял.

Edd.Dragon

Цитата: DEAD_RAT від 17 Березень 2009, 17:49:46
Извини, я тебя не так понял.
А по поводу частоты - очевидно, что ее необходимо учитывать в формуле. Формула без нее даже на приблизительность не может претендовать. Это тоже самое, что основать формулу на частоте, но не учитывать кол-во блоков.

l1nk

Имхо: 2 чипмейкера, которые изготавливают один и тот же товар, используя при этом одни и те же технологии, которые (по предварительному сговору-дружескому соглашению) показывают примерно одинаковые результаты производительности. Нет, некоторые отличия имеются, но они незначительныl
If I had a second chance, I'd make amends
Only to find myself losing in the end

DEAD_RAT

Цитата: l1nk від 17 Березень 2009, 20:50:16
Имхо: 2 чипмейкера, которые изготавливают один и тот же товар, используя при этом одни и те же технологии, которые (по предварительному сговору-дружескому соглашению) показывают примерно одинаковые результаты производительности. Нет, некоторые отличия имеются, но они незначительныl
Аргументируй хоть одно из своих утверждений.

Какой один и тот же товар? Какое предварительное соглашение? Какие такие незначительные отличия?

Edd.Dragon

#34
Цитата: l1nk від 17 Березень 2009, 20:50:16
Имхо: 2 чипмейкера, которые изготавливают один и тот же товар, используя при этом одни и те же технологии, которые (по предварительному сговору-дружескому соглашению) показывают примерно одинаковые результаты производительности. Нет, некоторые отличия имеются, но они незначительныl
Скажи то же самое о процессорах AMD Athlon X2 и Intel C2D.

Ну и мог бы почитать подробные статьи об архитектуре ATI в чипах третьей серии, изменений в 4-ой и архитектуре nVidia, практически одинаковой в 8 - 10 сериях.

Применимо ли будет после этого выражение "незначительные отличия"?

А то получается, что и КамАЗ и МАЗ - одного уровня грузовые, одного уровня автомобили, имеют мотор, колеса, кабину. И отличаются лишь незначительно.



Цитата: l1nk від 17 Березень 2009, 20:50:16которые (по предварительному сговору-дружескому соглашению) показывают примерно одинаковые результаты производительности.
Вообще-то тут не соглашение "виновато", а сами технологии, из которых оба уже натасканные в этом разработчика, выжимают почти максимум. Почему почти? Потому что идеальной архитектуры нет. Ну и производства тоже.


l1nk

Я имею в виду, что и Ати, и Нвидиа по сути занимаются тюнингом существующих чипов: увеличили число потоковых процессоров, подняли частоты и т.д.
Шлифовка архитектуры - вот и все!
Что за сговор? Вы не задумывались почему всегда в линейке обеих производителей есть изделия, чья производительность примерно одинакова. Правильно, монополисты делят рынок.
А то, как они добиваются схожих кадросекунд и баллов-личное дело компаний.
If I had a second chance, I'd make amends
Only to find myself losing in the end

Edd.Dragon

Цитата: l1nk від 18 Березень 2009, 10:00:27Вы не задумывались почему всегда в линейке обеих производителей есть изделия, чья производительность примерно одинакова.
Выше я писал почему.

Предел - он одинаков и для nVidia, и для ATI. А соревнуются они лишь в эффективности использования этого предела. И так же очевидно, что идеального решения нет и не будет в ближайшее время, а значит приходится искать золотую середину в наборе из десятков параметров и подходов. Поскольку над этим работают разные люди, то и выбор золтой середины у этих команд отличается.

А вот тягу ко всему прилепить мировой сговор я никогда не понимал.


Цитата: l1nk від 18 Березень 2009, 10:00:27Я имею в виду, что и Ати, и Нвидиа по сути занимаются тюнингом существующих чипов
Есть более эффективный подход, который ими отбрасывается по сговору?

Понимаешь, гениальные идеи не приходят каждый день. Более того, гениальные идеи зависят от технических возможностей, которые тоже не увеличиваются скачками ежегодно. И следовательно кардинально новая архитектура не в состоянии появляться в каждом поколении.