zakabum · 24-Апр-25 19:12(5 месяцев 8 дней назад, ред. 09-Июн-25 11:50)
RX6600 tserver Год Выпуска: 2021 Версия: 21.03.07 Видеокарта: RX6600 Navi23 Разработчик: AMD Таблэтка: не требуется Описание: Набор программ для тестирования видеопамяти Build date : 2021-08-10T14:04:54Z
Tserverlite Version: 21.03.07 @ ad4120b86cc0 Информация карты: ./agt -mccfg
./agt -pplist=full
./agt -mctraininfo
./agt -mcchannel
./agt -mcregdump
./memtune gd6info
./memtune mc Запуск тестов памяти: ./agt -ppmode=1
./tserver -boardtest=memfa ./memtune trainingcheck
./memtune fbcheck Общая информация: ./agt -i - вывод информации о картах, нумерация (Нумерация видеокарт AMD начинается с нуля и т.д. 0,1,2,3,4,5,....)
./tserver -boardtest=memfa (запуск теста памяти на всех видеокартах AMD в системе)
./tserver -boardtest=memfa -d=gpu.0 (запуск теста первой видеокарты в списке под номером 0 и тд)
./agt -mccfg (тип и объем памяти самой первой видеокарты в списке под номером 0)
./agt -mccfg -i=1 (тип и объем памяти второй видеокарты в списке под номером 1 и тд)
./agt -mem=1750 (установка частоты памяти 1750 MHz для теста, частоту устанавливать в пределах возможности памяти) Если при попытке выявить чипы которые начали "деградировать" - путем увеличения частоты работы памяти ничего не показало, то можно использовать «ПО чиповый» разгон: ./agt -mcchannel=A0
./agt -mem=1000 (частота устанавливается в зависимости от рабочей частоты памяти)
./tserver -boardtest = memfa А все чипы разом (напомним): ./agt -mem=1000
./tserver -boardtest=memfa При помощи следующих команд можно включить автоматический режим охлаждения и вывести карту в режим максимальной производительности: ./agt -fancontrol=2
./agt -ppmode=1
./agt -ppvddc=1.25 (прежде чем ставить, сначала посмотри следующий абзац) 1.25 - напряжение ядра в вольтах. При поднятии напряжения автоматически увеличились и частоты. Осторожно с этой командой, можно спалить кристалл GPU.
Прежде, чем выставлять напряжения и режимы, лучше посмотреть таблицу: ./agt -pplist=full Пример ./agt -pplist=full посмотреть таблицы напряжений и частот для определения максимального напряжения
Пример ./agt -ppvddc=1.15 задать напряжение на ядре, при этом частота ядра повышается, кстати и частота памяти тоже, можно вообще обходиться одной только этой командой. Пояснение можно получить по командам: ./agt
./agt powerplay
./agt clock
./agt vctf При использовании memfa используются тесты из набора AK403 и AK600, но в самом своем упрощённом варианте. Можно запустить отдельно данные тесты в более полном варианте.
Примеры: ./tserver -d=gpu.* -test=AK403.001 (простой тест, нагрузка не велика)
./tserver -d=gpu.* -test=AK403.003 (тест более серьезный, загружает больший объём памяти)
./tserver -d=gpu.* -test=AK403.004 (тоже самое что и .003, но гораздо дольше и тяжелее)
./tserver -d=gpu.* -test=AK600.001 (один из вариантов) Если присутствуют ошибки, они указываются не в логе, а в теле самого теста, после его завершения. Тесты группы АК – это тесты памяти, группы AG – тесты PCI-E. STD, SDMA и PK – тесты исключительно ГПУ, как в 3D, так и в прочих режимах.
Для того что бы узнать какие за что отвечают, можно просто ввести команду: ./tserver -d=gpu.* -test=STD и появится список тестов с кратким описанием. Однако это же можно прочитать в PDF файле в папке с тестом или приложенном отдельно в папке с доп материалами. Так же можно запустить другой вариант тест отличный от memfa, это: ./tserver -boardtest=quickmfg # (набор 3D тестов, gen3)
./tserver -boardtest=quickmfg2 # (набор 3D тестов, gen2) Дополнение: ./tserver –boardtest=quickmfg -maxfan можно запустить вентилятор на 100% при прохождении теста quickmfg. Начнем пожалуй с привычного memfa-basic для поиска EDC ошибок в видеопамяти, при этом поднимем частоты карты до рабочих частот командой ./agt –ppmode=1, в противном случае, например, память будет тестироваться на частоте в 300мгц, да и тест вовсе может не запуститься без нее.
Пример: ./agt -ppmode=1
./tserver -cf=tserver.cf -d=1 -blk=memfa-basic для просмотра результата просматриваем edc.log и memfa.log, так же может быть в log.txt ошибка неоходимая. Значения отличные от 0 и есть ошибки по каналу памяти в случае edc, в случае memfa, цифры вместо точек не есть гуд.
Так же используется и umc группа тестов памяти. ./agt -ppmode=1
./tserver -cf=tserver.cf -d=1 -blk=memfa-umc Так же есть инструмент хорошо подходящий для теста памяти, когда видеоадаптер «висит» в диспетчере с 43 ошибкой.
Это: ./memtune trainingcheck (весьма легкий тест, покажет когда нарушена пайка чипа и имеются фатальные повреждения чипа видеопамяти и ./memtune fbcheck (тест потяжелее, покажет сбойные просто чипы.) По результатам теста в след строке появится результат тестирования. (а ля Failed Channels: B0 B1) Тут стоит обратить внимание на то что теперь у амд в канале один чип памяти, а не два, как было у GCN. Так же редко, но может помочь команда ./memtune gd6info Она показывает вендора памяти и корректность ее определения по каналам. Дважды у меня получись идентифицировать сбойный канал памяти.
Отдельным пунктом идут команды сугубо информативные, бесполезные, но все же. ./memtune mc (так же помогает понять корректность определения каналов памяти)
./memtune (можно проверить определяется ли вообще видеоадаптер)
./agt -mccfg (так же определение кол-ва каналов)
./agt mctraininfo (объём поканально и вендор памяти, при сбойном чипе может показать какой, но редко) Так же можно использовать еще вариант тестирования, пакетом tserverlite. Например ./tserverlite -d=1 -test=umc404.001 это будет тест памяти, но при этом с нагрузкой в 3D. А для того что бы посмотреть перечень вариантов тестирования можно вбить команду ./tserverlite -d=1 -test=umc И она выдаст список возможных тестов. Или если нужен упор на видеочип, то смотрим набор тестов STD ./tserverlite -d=1 -test=std Ну и наконец, команда для тестирования после ремонта, при этом в некоторых случаях помогает отловить проблемы на вроде бы живом уже чипе. ./tserverlite -d=1 -skip_iommu_check -skip_consoleblank_check -test=std001.036 -test=std002 -test=std003 -test=std004.006 -test=std004.033 -test=std005 Варианты тесто можно комплектовать по-разному, но я запускаю обычно пачкой сразу тесты и на память, а на ядро. (std –ядро, umc память) Так же есть хороший тест с возможностью конфигурации. Его запускаем после поднятия частот до рабочих командой ./agt -ppmode=1 (проверьте наличие в папке файла Stutter.cf, без него магии не будет) : ./tserver -boardtest=extmfg И после этого теста можно понять, кто виновник, память или видеочип, в зависимости от того какие тесты проходит, а какие нет.