Коли драйвер вашої GPU потрапляє в петлю збоїв, машина перестає бути комп’ютером і перетворюється на ігровий автомат. Ви завантажуєтеся, з’являється робочий стіл, екран блимнув — і знову чорний екран, скидання драйвера, повтор. Іноді ви навіть не встигаєте ввійти, щоб натиснути «видалити».
Це одна з тих проблем, коли «просто перевстановити драйвер» звучить розумно і феєрично провалюється. Чиста інсталяція — це не одиночна дія. Це контрольована послідовність: зібрати докази, виключити Windows Update із ланцюга, використовувати безпечний режим, щоб драйвер не боровся з вами, видалити потрібні артефакти (не випадкові), а потім перевстановити з перевіркою. Зробіть це один раз і правильно — і зазвичай проблема зникає, якщо тільки апарат не вмирає насправді, а це вже інший рівень «цікавої» проблеми.
Як виглядає петля збоїв драйвера (і чим це не є)
«Петля збоїв драйвера» зазвичай означає, що графічний стек Windows постійно скидає дисплейний драйвер. Ви бачите:
- Екран мерехтить у чорний і назад, часто відразу після входу в систему.
- Додатки закриваються з помилками «пристрій видалено»/«пристрій завис» (DirectX/Vulkan).
- Логи в Переглядачі подій зі змістом «Display driver nvlddmkm stopped responding and has successfully recovered» або еквіваленти для AMD.
- Застряглий чорний екран з курсором або робочий стіл завантажується, але його неможливо використовувати.
- Коротке різке прискорення вентиляторів, потім тиша, а потім знову прискорення.
Чим це не є (більшість випадків):
- Випадковий злам гри з подальшим стабільним робочим столом. Це зазвичай проблема самої гри, накладання (overlay) або недостатнє живлення при undervolt.
- Повне вимкнення системи під навантаженням. Це часто пов’язано з БП, живленням, VRM або термозахистом.
- Постійні артефакти на екрані BIOS. Це часто означає фізичні пошкодження пам’яті або ядер GPU.
Якщо петля почалася саме після оновлення драйвера, оновлення Windows або заміни GPU — ставтеся до цього як до проблеми цілісності інсталяції, поки не доведено зворотне. Мета — повернути вас до стабільного базового драйвера з мінімальною містикою.
Жарт №1 (коротко, по темі): Петля збоїв драйвера GPU — це єдина бігова доріжка, де комп’ютер біжить, а програєте все ви.
Швидкий план діагностики (перший/другий/третій)
Перший крок: підтвердити, що це саме скидання драйвера, а не апаратне відключення
- Перевірте Переглядач подій на наявність скидань дисплейного драйвера та подій TDR.
- Перегляньте Reliability Monitor на повторювані записи «Windows Hardware Error Architecture» або «LiveKernelEvent».
- Перевірте температуру, якщо можете протриматися у Windows 60 секунд: якщо GPU миттєво досягає термолімітів, це проблема охолодження або термопасти.
Рішення: Якщо система раптово вимикається, перезавантажується без логів або показує артефакти в BIOS — припиніть танець з драйверами і перевіряйте БП/кабелі/апарат. Якщо це відновлювані скидання і чорні мерехтіння — переходьте до чистого робочого процесу по драйверам.
Другий крок: зупиніть «допомогу» Windows
- Відключіться від мережі або тимчасово вимкніть автоматичні оновлення драйверів Windows.
- Визначте, чи Windows постійно підставляє старий драйвер відразу після видалення.
Рішення: Якщо ви видаляєте драйвер і він з’являється знову після перезавантаження без вашої участі — Windows Update або DriverStore «заражає» систему. Потрібно ізолювати і взяти це під контроль.
Третій крок: ізолюйте стек драйвера та накладання (overlays)
- Завантажтеся в безпечному режимі, щоб видалити активний драйвер постачальника.
- Видаліть відомі конфліктні шари (записувачі накладань, RGB-ядрові драйвери, інструменти моніторингу) лише після зняття логів.
Рішення: Якщо безпечний режим стабільний, а звичайний режим — ні, значить це проблема драйвера/стека, а не «Windows зламався». Це можна виправити дисциплінованим підходом.
Цікаві факти та контекст (щоб поведінка стала зрозумілішою)
- TDR існує, щоб зберегти ваш робочий стіл. Windows Timeout Detection and Recovery (TDR) скидає GPU-драйвер, коли GPU здається завислим, замість того, щоб змушувати перезавантаження. Це добре для доступності, але заплутано під час збоїв.
- WDDM змінив правила гри. Починаючи з Windows Vista, Windows Display Driver Model виніс планування GPU і керування пам’яттю в структурованішу модель. Загальна стабільність покращилася, але залишки драйверів стали «цікавішими».
- Windows зберігає склад драйверів. DriverStore кешує пакети драйверів, щоб Windows могла їх повторно застосувати. Це чудово, коли зникає драйвер мережевої карти — менш чудово, коли відроджується пошкоджений пакет дисплея.
- DDU став популярним, бо дєїнсталятори — не хірурги. Фірмові деінсталятори часто залишають ключі реєстру, служби, пакети драйверів і налаштування, призначені для «плавних оновлень». Саме плавні оновлення не потрібні в петлі збоїв.
- «Чиста інсталяція» в інсталяторі NVIDIA — це не DDU. Вона скидає деякі налаштування та профілі, але не очищує повністю DriverStore і не видаляє всі артефакти.
- Гібридна графіка додає складнощів. Ноутбуки з iGPU + dGPU (Optimus, Advanced Optimus, AMD Switchable Graphics) можуть збоїти так, як настільні комп’ютери ніколи не збоять — неправильний пристрій отримує шлях виводу, неправильний режим живлення, неправильний режим мультиплексора.
- Hardware-accelerated GPU scheduling (HAGS) — відносно нова штука. Вона може бути корисною, але додає ще один підвижний елемент у конвеєрі. Коли система нестабільна, менше рухомих частин — це розумна стратегія.
- «Studio» проти «Game Ready» — здебільшого упаковка й частота валідації. Це не магія. Але зміна гілки може уникнути поганої регресії, коли одна доріжка відправляє помилку першою.
Точки прийняття рішень: програмне забезпечення, конфігурація чи апарат?
Ви не хочете витрачати три години на ідеальне очищення DDU, якщо GPU фізично виходить з ладу. І навпаки, не хочете відправляти GPU на RMA через те, що Windows Update перевстановлює невідповідний драйвер.
Сигнали, що ймовірно це програмне/конфігураційне
- Безпечний режим стабільний; звичайний режим мерехтить і скидається.
- Проблема почалася відразу після оновлення драйвера або Windows.
- Переглядач подій показує повторювані скидання дисплейного драйвера (TDR) без апаратних перезавантажень.
- Перехід на Microsoft Basic Display Adapter зупиняє петлю.
- Різні версії драйвера поводяться по-різному (навіть якщо обидві не ідеальні).
Сигнали, що ймовірно це апарат/живлення
- Артефакти в BIOS/UEFI або до завантаження Windows.
- Система втрачає живлення під навантаженням (мить вимкнення) без корисних логів.
- Петля збоїв драйвера триває після чистого встановлення ОС.
- Температури GPU або «гарячі точки» несподівано стрибають у холостому режимі або вентилятори не працюють.
- Заміна БП/кабелів/слоту змінює симптоми більше, ніж зміна драйвера.
Існує також сірий сектор: нестабільні undervolt/overclock, проблемна RAM або граничний БП можуть проявлятися як «збої драйвера», бо драйвер — це компонент, що фіксує наслідки. Драйвери звинувачують через те, що вони на місці події.
Одне перефразоване правило, яке варто тримати на стікері: перефразована ідея
— Werner Vogels (думка про надійність: усе ламається, тож проектуйте та експлуатуйте з цим урахуванням). Саме так слід ставитися до драйверів GPU у робочих станціях: припускайте, що вони можуть відмовити, і майте шлях для відновлення.
Практичні завдання з командами (12+), виводами та рішеннями
Ці завдання розраховані на Windows 10/11. Команди виконуються у підвищеному Command Prompt або PowerShell. Я використовую стиль підказки Linux у блоках коду через обмеження форматування; самі команди — рідні для Windows.
Завдання 1: Підтвердити GPU і поточну версію драйвера (еквівалент Диспетчера пристроїв через PowerShell)
cr0x@server:~$ powershell -NoProfile -Command "Get-CimInstance Win32_VideoController | Select-Object Name,DriverVersion,DriverDate | Format-List"
Name : NVIDIA GeForce RTX 3080
DriverVersion : 31.0.15.5161
DriverDate : 12/01/2023 00:00:00
Що це означає: Ви бачите активний драйвер, який Windows вважає завантаженим.
Рішення: Якщо версія не відповідає тій, що ви встановлювали (або змінюється після перезавантаження), Windows Update або інший пакет її перезаписує.
Завдання 2: Знайти скидання дисплейного драйвера (Переглядач подій через wevtutil)
cr0x@server:~$ wevtutil qe System /q:"*[System[(EventID=4101)]]" /c:5 /f:text
Event[0]:
Log Name: System
Source: Display
Event ID: 4101
Level: Warning
Description:
Display driver nvlddmkm stopped responding and has successfully recovered.
Що це означає: Event ID 4101 — класичний симптом TDR для відновлення дисплейного драйвера.
Рішення: Якщо 4101 повторюється через короткі інтервали після завантаження/входу, це петля збоїв драйвера, а не одиночний збій додатка.
Завдання 3: Перевірити LiveKernelEvent / підказки WHEA (дані Reliability Monitor через WMI)
cr0x@server:~$ powershell -NoProfile -Command "Get-CimInstance Win32_ReliabilityRecords | Where-Object { $_.SourceName -match 'Windows' -or $_.SourceName -match 'Hardware' } | Select-Object -First 5 TimeGenerated,SourceName,ProductName,Message | Format-List"
TimeGenerated : 2/4/2026 9:12:10 AM
SourceName : Windows
ProductName : Windows
Message : The Desktop Window Manager process has exited.
Що це означає: Повторні завершення DWM часто корелюють з нестабільністю драйвера GPU.
Рішення: Якщо ви бачите виправлені помилки WHEA разом із скиданнями GPU, розгляньте БП/RAM/стабільність PCIe як можливі фактори.
Завдання 4: Ідентифікувати пакети драйверів у DriverStore (pnputil)
cr0x@server:~$ pnputil /enum-drivers | findstr /i "nvidia amd display"
Published Name : oem42.inf
Original Name : nv_dispi.inf
Provider Name : NVIDIA
Class Name : Display adapters
Published Name : oem17.inf
Original Name : u0397489.inf
Provider Name : Advanced Micro Devices, Inc.
Class Name : Display adapters
Що це означає: DriverStore містить один або кілька пакетів драйверів дисплея — іноді від різних постачальників, якщо ви міняли GPU.
Рішення: Якщо є застарілі пакети неправильного постачальника, плануйте їх видалити під час очищення, щоб запобігти «відродженню» драйвера.
Завдання 5: Обережно видалити конкретний пакет драйвера
cr0x@server:~$ pnputil /delete-driver oem42.inf /uninstall /force
Driver package deleted successfully.
Що це означає: Це видаляє пакет з DriverStore і деінсталює пристрої, що його використовують.
Рішення: Якщо видалення не вдається через «використовується», ви не відключилися чисто — використайте безпечний режим або спочатку відключіть пристрій.
Завдання 6: Підтвердити, що Windows не автоматично встановлює драйвери (налаштування установки пристроїв через реєстр)
cr0x@server:~$ reg query "HKLM\SOFTWARE\Microsoft\Windows\CurrentVersion\DriverSearching" /v SearchOrderConfig
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\DriverSearching
SearchOrderConfig REG_DWORD 0x1
Що це означає: 1 зазвичай означає, що Windows дозволена шукати драйвери через Windows Update.
Рішення: Для контрольованого відновлення тимчасово встановіть це значення в 0 та/або відключіть мережу перед перевстановленням.
Завдання 7: Вимкнути автоматичні оновлення драйверів через реєстр (тимчасовий контроль)
cr0x@server:~$ reg add "HKLM\SOFTWARE\Microsoft\Windows\CurrentVersion\DriverSearching" /v SearchOrderConfig /t REG_DWORD /d 0 /f
The operation completed successfully.
Що це означає: Windows має припинити автоматичне завантаження драйверів через Windows Update.
Рішення: Зробіть це перед очищенням/перевстановленням, потім відновіть, якщо ваша інфраструктура цього вимагає.
Завдання 8: Перевірити конфігурацію завантаження безпечного режиму (bcdedit)
cr0x@server:~$ bcdedit /enum | findstr /i safeboot
safeboot Minimal
Що це означає: Система налаштована завантажуватися в безпечному режимі (Minimal).
Рішення: Використовуйте це, якщо не можете надійно дістатися до Параметрів розширеного запуску.
Завдання 9: Встановити безпечний режим для наступного завантаження (потім перезавантажитись)
cr0x@server:~$ bcdedit /set {current} safeboot minimal
The operation completed successfully.
Що це означає: Наступне завантаження відбудеться в безпечному режимі.
Рішення: Після очищення зніміть прапорець safeboot, інакше ви продовжите завантажуватися в безпечному режимі й дивуватиметесь відсутності звуку.
Завдання 10: Видалити прапорець безпечного режиму (повернення до нормального завантаження)
cr0x@server:~$ bcdedit /deletevalue {current} safeboot
The operation completed successfully.
Що це означає: Відновлює нормальну поведінку завантаження.
Рішення: Запустіть це після DDU і коли будете готові встановити новий драйвер.
Завдання 11: Перевірити, чи Windows використовує Microsoft Basic Display Adapter (хороша базова точка)
cr0x@server:~$ powershell -NoProfile -Command "Get-PnpDevice -Class Display | Format-Table -AutoSize Status,Class,FriendlyName,InstanceId"
OK Display Microsoft Basic Display Adapter PCI\VEN_10DE&DEV_2206&SUBSYS...
Що це означає: Ви на базовому драйвері. Погана роздільна здатність, але досить стабільно для роботи.
Рішення: Якщо Basic Display Adapter стабільний, то петля збоїв майже напевне в драйвері постачальника або у налаштуваннях.
Завдання 12: Зняти список встановленого ПЗ, що може підключатися до стека
cr0x@server:~$ powershell -NoProfile -Command "Get-ItemProperty HKLM:\Software\Microsoft\Windows\CurrentVersion\Uninstall\*,HKLM:\Software\WOW6432Node\Microsoft\Windows\CurrentVersion\Uninstall\* | Where-Object { $_.DisplayName -match 'NVIDIA|AMD|Radeon|GeForce|Afterburner|Rivatuner|Overlay' } | Select-Object DisplayName,DisplayVersion | Sort-Object DisplayName | Format-Table -AutoSize"
AMD Software 24.1.1
MSI Afterburner 4.6.5
RivaTuner Statistics Server 7.3.5
Що це означає: У вас можуть бути інструменти, що хук-нуть стек (накладки, моніторинг тощо).
Рішення: Не видаляйте все підряд. Але якщо чиста інсталяція драйвера все одно викликає петлю — видаліть накладки і інструменти моніторингу наступними кроками.
Завдання 13: Перевірити цілісність системних файлів (бо збої можуть пошкодити файли)
cr0x@server:~$ sfc /scannow
Beginning system scan. This process will take some time.
Windows Resource Protection found corrupt files and successfully repaired them.
Що це означає: Було виявлено та виправлено пошкоджені системні файли Windows.
Рішення: Якщо SFC щось відремонтував, виконайте DISM; нестабільні драйвери можуть залишити ОС напівпошкодженою.
Завдання 14: Відновити сховище компонентів Windows (DISM)
cr0x@server:~$ DISM /Online /Cleanup-Image /RestoreHealth
Deployment Image Servicing and Management tool
Version: 10.0.22621.1
The restore operation completed successfully.
Що це означає: Сховище компонентів знову цілісне.
Рішення: Якщо DISM постійно падає, можливо, маєте глибшу корупцію ОС — виправте це перед тим, як звинувачувати драйвер GPU.
Завдання 15: Перевірити, чи GPU видає виправлені помилки WHEA PCIe (сигнал апаратного характеру)
cr0x@server:~$ wevtutil qe System /q:"*[System[Provider[@Name='Microsoft-Windows-WHEA-Logger'] and (EventID=17 or EventID=18)]]" /c:5 /f:text
Event[0]:
Provider Name: Microsoft-Windows-WHEA-Logger
Event ID: 17
Level: Warning
Description:
A corrected hardware error has occurred.
Що це означає: Виправлені апаратні помилки можуть корелювати з нестабільністю PCIe, маргінальним БП, кабелями riser або агресивним розгоном.
Рішення: Якщо події WHEA зростають під час скидань драйвера, розгляньте видалення riser-кабелів, перепідключення карти, оновлення BIOS/чипсету і зниження розгону/undervolt.
Контрольні списки / покроковий план (DDU + безпечний режим)
Принципи (правила, що запобігають повторній роботі)
- Контролюйте середовище: ніяких несподіваних інсталяцій Windows Update під час очищення.
- Видаляйте драйвери, коли вони не активні: безпечний режим зменшує блокування файлів і запущені служби.
- Перезавантажуйтеся в потрібні моменти: не постійно, але й не ніколи.
- Змінюйте одну змінну одночасно: не «також підправляйте реєстр TdrDelay і undervolt» в одній операції.
Підготовка (5 хвилин, зекономить години)
- Завантажте правильний інсталятор драйвера для вашої GPU і ОС заздалегідь. Покладіть його на робочий стіл. Ви будете офлайн пізніше.
- Завантажте DDU (Display Driver Uninstaller) заздалегідь і розпакуйте в відому папку (наприклад,
C:\Tools\DDU). - Занотуйте ваші налаштування розгону GPU (Afterburner/Adrenalin) і скиньте до дефолту, якщо можете. Якщо ні — не панікуйте, ми все одно зробимо чисту інсталяцію.
- Відключіться від мережі (витягніть Ethernet, вимкніть Wi‑Fi) або вимкніть пошук драйверів (Завдання 7). Зробіть обидва, якщо Windows раніше була надто «корисною».
- Створіть точку відновлення, якщо система достатньо стабільна. Не тому що точки відновлення ідеальні, а тому що це дешева страховка.
Покроково: робочий процес чистої інсталяції, що дійсно працює
-
Примусово встановіть безпечний режим для наступного завантаження (якщо не можете надійно зайти в Розширений запуск).
cr0x@server:~$ bcdedit /set {current} safeboot minimal The operation completed successfully.Рішення: Якщо ця команда повертає access denied, ваша оболонка не підвищена. Виправте це спочатку.
-
Перезавантажтесь у безпечний режим.
У безпечному режимі система має використовувати базовий драйвер і бути менш схильною до збоїв. Якщо сам безпечний режим падає — підозрюйте апарат або серйозну корупцію ОС.
-
Запустіть DDU від імені адміністратора і виберіть правильний тип пристрою (GPU) та вендора (NVIDIA або AMD).
Налаштування, які зазвичай потрібні: заборонити завантаження драйверів з Windows Update (DDU може встановити політики). Тут командність інструмента — перевага.
Дія: «Clean and restart» — звичайний вибір. «Clean and shutdown» корисно, якщо ви замінюєте карту.
-
Після перезавантаження DDU, зніміть прапорець безпечного режиму, щоб можна було завантажитись у звичайному режимі.
cr0x@server:~$ bcdedit /deletevalue {current} safeboot The operation completed successfully.Рішення: Якщо ви забудете це зробити, продовжуватимете завантаження у безпечному режимі і помилково думатимете, що драйвер не встановився. Він встановився; просто ви в безпечному режимі.
-
Залишайтеся офлайн і завантажуйтесь у звичайному режимі.
На цьому етапі Windows має працювати на Microsoft Basic Display Adapter. Роздільна здатність може бути неправильна — це нормально. Головна мета — стабільність.
Перевірте:
cr0x@server:~$ powershell -NoProfile -Command "Get-PnpDevice -Class Display | Select-Object -ExpandProperty FriendlyName" Microsoft Basic Display Adapter -
Встановіть драйвер, який ви заздалегідь завантажили, а не той, який Windows хоче підвантажити.
- NVIDIA: розгляньте опцію «Driver only», якщо діагностуєте, і відкладіть GeForce Experience до стабілізації.
- AMD: оберіть опцію «Factory Reset» тільки якщо ви не використовували DDU (DDU вже виконав основну роботу). Якщо ви вже запустили DDU, зазвичай нема потреби в обох діях.
Рішення: Якщо петля повертається під час інсталяції — скасувати і перезавантажитись; потім спробуйте іншу відому стабільну версію драйвера (часто попередню гілку). Тут «останній» не завжди найкращий вибір.
-
Перезавантажтеся один раз після інсталяції.
Не робіть додаткових змін одночасно. Спочатку підтвердіть стабільність і правильну версію драйвера:
cr0x@server:~$ powershell -NoProfile -Command "Get-CimInstance Win32_VideoController | Select-Object Name,DriverVersion | Format-Table -AutoSize" Name DriverVersion ---- ------------- NVIDIA GeForce RTX 3080 31.0.15.5161 -
Увімкніть мережу і переконайтеся, що Windows не перезаписує драйвер.
Почекайте кілька хвилин. Перезавантажте ще раз. Перевірте версію драйвера. Якщо вона змінилася — у вас проблема з політикою оновлення драйверів (див. Типові помилки).
-
Тільки після стабільності: повертайте додаткові шари ПЗ.
Накладки, моніторинг, RGB-драйвери, інструменти запису — додавайте по одному. Так, це нудно. Саме тому метод працює.
Жарт №2 (коротко, по темі): Безпечний режим — як навчальна тривога для ПК: усе виглядає гірше, але нарешті видно, хто саме підпалює дим.
Три корпоративні міні-історії з практики
Міні-історія 1: Інцидент через неправильне припущення
У медіа-команді було кілька високопродуктивних Windows-робочих станцій для кольорокорекції та апаратно-прискореного кодування. Оновлення драйвера вийшло в рамках «рутинного патчу». Наступного ранку одна робоча станція почала мерехтіти що кілька секунд. Оператор зробив те, що роблять усі: перевстановив найновіший драйвер ще раз, бо «можливо він був пошкоджений». Стає ще гірше.
Неправильне припущення: інсталятор — авторитет. Вони вважали, що якщо інсталятор завершився, система працює саме під цією версією. Насправді Windows Update мав драйвер в черзі і постійно змагався з інсталятором постачальника. Після кожного перезавантаження система опинялася на різних збірках драйвера з різними компонентами. Користувач бачив випадковість. Операція — тикет підтримки, що відтворюється тільки коли ніхто не дивиться.
Ми зібрали короткий набір логів: спалахи Event ID 4101 після входу, версія драйвера змінювалася між перезавантаженнями, і в DriverStore були пакети для NVIDIA та старого AMD, яким користувалися шість місяців тому. Ніхто не пам’ятав той старий обмін. Але машина пам’ятала.
Виправлення не було героїчним: ізолювати робочу станцію від мережі, завантажитись у безпечному режимі, запустити DDU, видалити застарілі пакети драйверів, встановити відому-стабільну гілку драйвера, і підключати мережу лише після підтвердження, що версія драйвера збереглася. Петля зникла. Найцінніший крок був найменш привабливий: завадити Windows «допомагати».
Постмортемний урок: ви не маєте версії драйвера, поки не доведете, що вона зберігається після перезавантаження з увімкненим Windows Update. Все інше — відчуття.
Міні-історія 2: Оптимізація, що відвернулася
У фінансовому відділі графіки GPU-прискорених діаграм працювали на торгових десктопах. Хтось прочитав, що «відключення TDR покращує продуктивність» для довготривалих обчислень на GPU і вирішив стандартизувати зміну реєстру для збільшення TDR-таймауту. Це не було зломисно. Це класичне «сховати помилку, щоб вона зникла».
Це спрацювало рівно тиждень. Потім підмножина машин почала зависати жорстко замість відновлення. Раніше при зависанні GPU відбувався скидання драйвера, додаток падав, і користувач просто його перезапускав. Дратівливо, але виживано. Після зміни ОС чекала довше, перш ніж визнати зависання — це означало, що весь робочий стіл довше був не відгукливим. Люди сприймали це як «ПК мертвий» і вимикали його — часто під час запису на диск.
Другорядні наслідки були гіршими: примусове відключення призвело до подекуди ремонту файлової системи на завантаженні, корупції профілю і однієї машини в петлі автоматичного ремонту. «Покращення продуктивності» перетворило відновлювану аплікаційну помилку на проблему надійності системи.
Ми відкликали зміну TDR, повернули таймаути за замовчуванням, а потім виправили справжню причину: конкретна версія драйвера + комбінація накладки, що викликала зависання під час швидких переключень мультиекранів. Робочі станції повернулись до передбачуваної поведінки: якщо зависання сталося, воно швидко відновлювалось, логувалось чітко і не заохочувало користувачів виривати шнур живлення.
Урок: не налаштовуйте механізми виявлення помилок, поки не зрозумієте, що саме вони виявляють. TDR — не ворог, це парашут.
Міні-історія 3: Нудна практика, що врятувала день
Одна інженерна команда підтримувала лабораторію Windows-машин для валідації збірок з GPU-прискоренням. Нічого гламурного. Просто набір машин, які мали бути стабільними і відтворюваними. У команди була звичка, що здавалася бюрократичною: кожна машина мала «листок базового драйвера» з моделлю GPU, гілкою драйвера, точним ім’ям інсталятора і датою сертифікації для лабораторії.
Одного дня кілька машин почали показувати скидання драйвера після рутинного кумулятивного оновлення Windows. Паніка намагалася статися. Але листок базового драйвера зробив усе нудним. Вони порівняли версії драйверів, побачили, що дві машини відхилились на іншу збірку, і швидко ідентифікували, що Windows Update підсунув новий драйвер лише цим двом.
Відповідь була простою й швидкою: ізоляція мережі, безпечний режим, DDU, перевстановлення базового драйвера і застосування політики блокування автоматичних оновлень драйверів для цього класу пристроїв. Виправлення зайняло менше години, бо команда не сперечалася, що є «добре». Вони вже мали відому-стабільну конфігурацію і спосіб повернутися до неї.
Оце неприваблива правда надійності: шлях чистого відкату коштує більше, ніж тисяча хитрих налаштувань. Листок базового драйвера не запобігав проблемі, але запобіг хаосу. У виробництві це перемога.
Типові помилки: симптом → корінь → виправлення
1) Симптом: драйвер самовідновлюється після його видалення
Корінь: Windows Update і/або DriverStore містить пакет драйвера дисплея, який автоматично застосовується під час завантаження.
Виправлення: Відключіться від мережі; встановіть SearchOrderConfig в 0; використайте DDU у безпечному режимі; видаліть застарілі пакети за допомогою pnputil. Перевірте, що версія драйвера зберігається після перезавантаження з включеною мережею.
2) Симптом: безпечний режим стабільний, у звичайному режимі петля
Корінь: Стек драйвера постачальника, налаштування або програми, що хук-нуть стек (накладки/моніторинг/RGB).
Виправлення: DDU у безпечному режимі; чиста інсталяція драйвера; відкладіть встановлення накладок; тестуйте стабільність після кожної зміни.
3) Симптом: чорний екран після інсталяції, але система «жива» (працює RDP)
Корінь: Проблема шляху дисплея/режиму виводу (EDID мультиекрана, частота оновлення, HDR, переговори кабелю/порту) або поганий дефолт роздільної здатності після перезавантаження.
Виправлення: Завантажіться в безпечному режимі і видаліть драйвер; завантажтесь у звичайному режимі з Basic Display Adapter; підключіть один монітор до відомого порту/кабелю; встановіть драйвер; потім підключіть інші монітори.
4) Симптом: «nvlddmkm» або AMD-скидання лише при запуску ігор
Корінь: Нестабільний OC/UV, поганий стан shader cache, конфлікт накладки або регресія драйвера з конкретним API-шляхом.
Виправлення: Поверніть GPU до заводських налаштувань; очистіть shader cache через інтерфейс драйвера; перевстановіть драйвер; вимкніть накладки; якщо проблема лишається — відкотіться на попередню гілку драйвера.
5) Симптом: випадкове мерехтіння + скидання після оновлення Windows, особливо з кількома моніторами
Корінь: Оновлення змінило поведінку графічної підсистеми; взаємодії HAGS/VRR/HDR; прошивка монітора має нюанси.
Виправлення: Тимчасово вимкніть HAGS і VRR; протестуйте з одним монітором; перевстановіть стабільний драйвер; при можливості оновіть прошивку монітора.
6) Симптом: петля збоїв триває навіть після DDU і перевстановлення
Корінь: Глибша корупція ОС, конфліктні ядрові драйвери або реальна апаратна нестабільність (PCIe, БП, GPU).
Виправлення: Запустіть SFC/DISM; перевірте події WHEA; перепідключіть GPU; видаліть riser-кабелі; протестуйте інший БП/кабелі; запустіть тест пам’яті; розгляньте чисту інсталяцію ОС або апаратний RMA, якщо з’являються артефакти в BIOS.
7) Симптом: система жорстко перезавантажується або вимикається під навантаженням GPU
Корінь: Проблема живлення, здатність БП працювати з транзієнтами, проблема кабелю/конектора або захист VRM/термічний захист.
Виправлення: Використовуйте окремі PCIe-кабелі живлення (без даisy-chain для потужних карт), перевірте щільність з’єднань, зменшіть ліміт потужності для тесту, переконайтеся у потужності/якісності БП, інспектуйте температури і гарячі точки.
8) Симптом: обрано опцію «чиста інсталяція», але проблеми лишаються
Корінь: Фірмова «чиста інсталяція» не є повним видаленням; залишки залишаються в DriverStore/службах/налаштуваннях.
Виправлення: Використайте DDU у безпечному режимі і контролюйте Windows Update. Розглядайте фірмову «чисту інсталяцію» як зручну опцію, але не як основний інструмент усунення.
Операційне мислення: чому DDU + безпечний режим — правильний стандарт
З точки зору SRE, петля збоїв драйвера — це «flapping» залежність. Драйвер дисплея постійно падає, Windows постійно відновлює його, і ваша робоча станція застрягає в частковому відключенні. Інстинкт — «робити щось» постійно: перевстановити, перезавантажити, ще раз перевстановити — поки не стане стабільно.
Такий підхід провалюється, бо система недетермінована під час петлі. Файли блоковані. Служби напівзапущені. Windows Update змагається з вами. Налаштування напівзастосовані. Це як намагатися замінити диск, поки RAID-контролер постійно додає того самого пошкодженого члена з шафи.
Безпечний режим зменшує кількість активних компонентів. DDU зменшує кількість залишкових артефактів. Разом вони створюють передбачуване вікно обслуговування, у якому система може сходитися до відомого стану.
Деталі робочого процесу DDU, які мають значення (і частини, які люди пропускають)
Офлайн — не опціонально (якщо ви бачили «відродження» драйвера)
Якщо Windows може дістатися до Windows Update, він може завантажити драйвер у невдалий момент — між вашим видаленням і перевстановленням. Це може залишити систему з невідповідними компонентами: панель керування від однієї версії, ядро драйвера від іншої, аудіо-драйвер від третьої. Ось як втрачається звук HDMI, або панель керування відмовляється відкриватися, або драйвер скидається при відкритті налаштувань.
Практичне правило: відключіть Ethernet. Вимкніть Wi‑Fi. Потім робіть роботу. Якщо ви в корпоративному середовищі і це складно — використайте політику блокування оновлень драйверів і перевірте її.
Видаляйте лише те, що маєте намір видалити
DDU — потужний. Так само і pnputil /delete-driver. Сила — не те саме, що мудрість.
- Якщо ви на NVIDIA, не видаляйте чипсетні драйвери тільки тому, що «їх теж називають NVIDIA». NVIDIA робить пакети чипсету для деяких платформ; видалення неправильного пакета може зламати зберігання або мережу.
- Якщо ви на AMD, пам’ятайте, що AMD охоплює GPU і чипсетну екосферу. Будьте точними з тим, що видаляєте.
Мета — видалити пакети драйверів дисплея та їхні служби/налаштування — нічого зайвого. Ми дезінфікуємо графічний стек, а не проводимо екзорцизм.
Перезавантаження — частина збіжності стану
Люди або перезавантажуються після кожної дії, або уникають перезавантажень, ніби вони коштують грошей. Правильна кількість: перезавантажуйтесь, коли інструмент очищення просить про це, і перезавантажтесь один раз після інсталяції. Додайте ще одне перезавантаження, якщо валідуєте «зберігається драйвер після завантаження з мережею?» Ось і все.
Тримайте під рукою відому-стабільну версію драйвера
«Останній» добре для фіч і виправлень ігор. «Відома-стабільна» — краще для роботи. Якщо ви діагностуєте, обирайте стабільність першою. Використайте версію драйвера, яка вже працювала без проблем, або ту, що валідується вашою організацією.
Питання та відповіді
1) Чи справді мені потрібен DDU? Хіба не можна просто видалити через «Програми та компоненти»?
Якщо ви в петлі збоїв — так, вам часто дійсно потрібен DDU. Деінсталятори додатків не завжди надійно видаляють пакети DriverStore, служби і налаштування таким чином, щоб запобігти повторному застосуванню. DDU в безпечному режимі дає чисту базу для відновлення.
2) Чи достатньо галочки «Clean installation» в інсталяторі NVIDIA?
Ні. Вона скидає деякі налаштування та профілі, але це не те саме, що повне видалення пакетів та запобігання повторній інсталяції Windows. Використовуйте цю опцію як зручність після стабілізації, але не як основний засіб відновлення.
3) Чи ставити GeForce Experience / AMD overlay під час діагностики?
Не на початку. Спочатку досягніть стабільності драйвера з мінімумом доповнень. Потім поверніть інструменти управління, якщо потрібно. Кожна накладка і рекордер додають ще одне підключення в графічний конвеєр.
4) Що якщо безпечний режим все одно петляє?
Це червоний прапор. Можливі причини: серйозна корупція ОС, проблеми зі сховищем або апаратна нестабільність настільки сильна, що навіть базові шляхи виводу викликають проблеми. Запустіть SFC/DISM, перевірте WHEA логи і розгляньте апаратні перевірки (перепідключення GPU, БП/кабелі, тест пам’яті).
5) Чи потрібно міняти реєстрові ключі TDR, як TdrDelay?
Зазвичай ні. Налаштування TDR — це крайній засіб для специфічних робочих навантажень (наприклад, довгі обчислення на GPU) і можуть перетворити відновлювані зависання на тривалі блокування. Виправляйте корінь проблеми: версію драйвера, накладки, живлення/терміку або цілісність ОС.
6) Чому петля збоїв відбувається відразу після входу?
Вхід запускає багато GPU-прискорених дій: композит DWM, стартові програми, накладки, конфігурацію кількох моніторів, переговори HDR/VRR та зміни станів живлення. Якщо драйвер крихкий, цей сплеск і покаже проблему.
7) Я перейшов з AMD на NVIDIA (або навпаки). Це особливий випадок?
Так. Перехід між постачальниками часто залишає пакети і служби від старого драйвера. Windows також може зберегти старі пакети в DriverStore. DDU плюс очищення DriverStore — правильний хід, а опція «clean and shutdown» в DDU корисна при фізичній заміні картки.
8) Як дізнатися, чи Windows Update перезаписує мій драйвер?
Перевірте версію драйвера (Завдання 1), перезавантажте з підключеною мережею і перевірте знову. Якщо вона змінилася без вашої участі — Windows Update або політика установки пристроїв це робить. Виправте це, перш ніж продовжувати тестувати версії драйверів, інакше ви отримаєте хаос.
9) Чи може поганий HDMI/DisplayPort кабель викликати щось схоже на петлю збоїв драйвера?
Поганий кабель зазвичай викликає мерехтіння, пропадання сигналу або відсутність зображення — не постійні події скидання драйвера. Але проблеми переговорів мультиекранів можуть виглядати подібно. Якщо логи показують TDR-скидання, це більше ніж просто кабель; проте спростіть конфігурацію до одного монітора на відомому кабелі як крок ізоляції.
10) Чи варто виконувати повну перевстановлення Windows?
Лише після того, як ви виконали контрольований робочий процес DDU і перевірили, що Windows не повторно інсталює драйвери. Якщо ви все ще маєте петлю після чистого драйвера без накладок і перевірок цілісності ОС — чиста інсталяція ОС може відділити програмну деградацію від апаратної реальності.
Висновок: наступні кроки, які справді працюють
Якщо ваша система застрягла в петлі збоїв драйвера NVIDIA/AMD — припиніть імпровізації. Надійний шлях такий:
- Доведіть, що це петля скидань драйвера (Event ID 4101, виходи DWM, Reliability Monitor).
- Відріжте шлях повторного інфікування драйвером (офлайн + тимчасове відключення автоматичного пошуку драйверів).
- Завантажтесь у безпечному режимі і запустіть DDU, щоб чисто видалити стек вендора.
- Завантажтесь у звичайному режимі з Basic Display Adapter, встановіть завчасно завантажений відомо-стабільний драйвер, потім перезавантажтеся один раз.
- Увімкніть мережу і перевірте, що версія драйвера зберігається після перезавантаження.
- Поверніть накладки/інструменти налаштування по одному. Якщо нестабільність повернеться — ви знайшли винуватця.
Коли ви дієте так, система сходиться до стабільності. Коли ви цього не робите, ви «тестуєте» різні версії драйверів, в той час як Windows Update міняє їх під вами, а накладка вписується в кожен виклик графічного API. Це не діагностика — це перформанс-арт.
Якщо після дисциплінованої чистої інсталяції петля лишається — і особливо якщо ви бачите WHEA-події або артефакти в BIOS — ставтесь до цього як до проблеми апаратної стабільності. Перепідключіть GPU, перевірте кабелі, протестуйте БП і зніміть будь-який розгін/undervolt. Драйвери можуть бути багаті на помилки. Апарат може втомитися. Ваше завдання — з’ясувати, хто сьогодні бреше.