Дизайн охолодження: 2-вентилятори проти 3-вентиляторів — що насправді змінюється

Було корисно?

Ви купуєте картку або шасі з «кращим охолодженням», бо хочете поменше сюрпризів. А потім сюрприз приходить все одно:
температури гарячих точок стрибнуть, вентилятори завиють, тактові частоти похитнуться, і машина звучить, ніби готується до рулювання на злітну смугу.

В інтернеті кажуть «три вентилятори краще». Іноді так. Іноді це просто довший радіатор з тими самими вузькими місцями,
плюс боротьба за повітряний потік з корпусом і нове джерело вібрації. Розберемося, що дійсно змінюється при переході від двох вентиляторів
до трьох, і як зрозуміти, чи ви вирішуєте теплову проблему — чи купуєте іншу.

Що насправді змінюється: кількість вентиляторів проти теплової системи

«2-вентилятори проти 3-вентиляторів» — це скорочення. Насправді ви порівнюєте повні теплові системи:
об’єм радіатора, щільність ребер, конструкція теплових труб/випарної камери, контакт бази, діаметр вентиляторів,
крива обертів, геометрія кожуха та взаємодія охолоджувача з повітряним потоком корпусу чи шасі.

Додавання третього вентилятора може зробити три корисні речі — якщо інша частина конструкції не підведе:

  • Нижчі оберти при тому самому обсязі повітря (зниження шуму та збільшення ресурсу підшипників).
  • Розподіл повітря по більшій площі ребер (зменшує локальне обертання повітря та градієнти гарячих точок).
  • Можливість довшого радіатора (більша поверхня для віддачі тепла в повітря).

Але третій вентилятор також створює нові способи програти:

  • Взаємна інтерференція повітря: вентилятори можуть «боротися» один з одним або з профілем тиску корпусу спереду-назад.
  • Невідповідність статичного тиску: більше вентиляторів не означає більше тиску там, де стоси ребер обмежують потік.
  • Більше точок відмови: один вентилятор може зупинитися непомітно; три вентилятори можуть відмовляти цікавішим способом.
  • Більша довжина і маса: провисання, напруга кронштейнів і гірший потік повітря, якщо карта перекриває шлях впуску.

Операційна істина така: два вентилятори на добре розрахованому радіаторі виграють у трьох вентиляторах на тісному.
А тривентиляторний охолоджувач, що залежить від дисципліни повітряного потоку корпусу, буде класним в оглядах і жахливим у вашій реальній коробці,
якщо впуск позбавлений повітря або верхній вихід налаштований неправильно.

Рішення, яке ви приймаєте, — не «два проти трьох». Це «який запас по теплу потрібен для мого навантаження,
моєї температури навколишнього середовища, моєї терпимості до шуму та моєї реальності обслуговування».

Фізика простими операційними словами: повітряний потік, тиск і теплові шляхи

Тепло має пройти три ворота

Більшість збоїв охолодження — це не «проблема кількості вентиляторів». Це відмови в тепловому шляху:

  1. Кристал → теплорозподільник/база: тиск кріплення, плоскість, термопаста, якість випарної камери.
  2. База → ребра: теплові труби, паяння, розподіл стосу ребер.
  3. Ребра → повітря: швидкість повітря, статичний тиск, турбулентність і рециркуляція.

Два вентилятори проти трьох впливають здебільшого на третій «ворота». Але якщо перші ворота погані (нерівне кріплення), ви отримаєте гарячу точку
незалежно від того, скільки вентиляторів прикрутили. І якщо другі ворота занадто малі, ви побачите різницю температур по всій довжині ребер, де
один кінець радіатора робить всю роботу, а решта — лише декоративний алюміній.

Повітряний потік (CFM) — це не вся історія; статичний тиск вирішує, чи пройде повітря через ребра

Щільні стоси ребер поводяться як фільтр. Ви можете мати вражаючі специфікації потоку у вільному повітрі і все одно отримати посереднє охолодження, якщо
вентилятори не можуть утримувати тиск проти обмеження. Тривентиляторні конструкції часто використовують вентилятори більшого діаметра при нижчих обертах, що
добре для шуму, але деякі моделі жертвують тиском заради тиші — чудово на відкритому стенді, гірше в корпусі з пиловими фільтрами і декоративною передньою панеллю.

Ключовий операційний показник — не «кількість вентиляторів». Це стабільність температури під тривалим навантаженням при
вашому цільовому рівні шуму та навколишній температурі. Саме це тримає частоти стабільними, уникає тротлінгу й зменшує теплове циклювання.

Чому температура гарячої точки (junction) поводиться інакше, ніж «температура GPU»

Сучасні GPU повідомляють кілька сенсорів: крайова температура, температура пам’яті і hotspot/junction.
Охолоджувач може виглядати нормальним за середньою температурою, але при цьому мати жахливий перепад гарячої точки, якщо контакт бази нерівномірний або випарна камера погано розподілена.
Тут тривентиляторні дизайни часто отримують незаслужену похвалу: додаткове повітря знижує середню температуру ребер, але не може виправити поганий інтерфейс. Якщо бачите великий і постійний перепад hotspot, підозрюйте контакт і розподіл тепла перш ніж звинувачувати кількість вентиляторів.

Практичне правило: якщо середня температура нормальна, але hotspot кричить, у вас проблема з провідністю. Якщо обидві високі,
то це проблема повітряного потоку або площі ребер. Якщо температури в нормі, але шум жахливий — проблема з кривою вентиляторів та тиском.

Шум: чому «більше вентиляторів» може бути тихішим (або голоснішим)

Шум — це не тільки оберти. Це форма лопаті, тип підшипника, резонанс в кожусі та те, чи є повітря плавним або хаотичним.
Три вентилятори можуть бути тихішими, бо кожен може працювати повільніше, щоб перемістити схоже повітря. Але три вентилятори також можуть бути більш
дратівливими, бо:

  • Накладання частот проходу лопаті: три трохи різні тону стають хором, який важко не почути.
  • Шум взаємодії: турбулентність від одного вентилятора потрапляє на всмоктування наступного.
  • Зв’язування з корпусом: довші карти сидять ближче до панелей корпусу; вібрація передається в шасі.
  • Гістерезис і нарощування оборотів: більше вентиляторів — більше систем керування, які можуть неправильно працювати.

В операційних термінах: якщо ваше навантаження стрибкоподібне (короткі збірки, імпульси інференсу, зміни сцен у грі), охолоджувач, що агресивно нарощує обороти,
буде звучати гірше за той, що трохи тепліший, але стабільний. Ваш слух терпить менше коливань, ніж постійний шум.

Перший жарт (ви отримуєте рівно два): Тривентиляторна карта може бути тихішою — якщо тільки її крива вентиляторів не написана як панічна атака.

На що дивитися в вимірюваннях

Ігноруйте однозначні шумові чарти. Вам потрібне:

  • Шум у стійкому стані після 10–15 хвилин навантаження.
  • Поведение нарощування (наскільки швидко змінюються RPM за секунду).
  • Мінімальні стабільні обороти (деякі вентилятори клацають або зупиняються нижче порогу).
  • Частотний характер (скрип підшипника, тональний вой, шипіння турбулентності).

Моя упереджена порада: якщо вам важливий шум, віддавайте пріоритет охолоджувачу, який може утримувати температуру при завантаженні з роботою вентилятора нижче ~50–60%.
Кількість вентиляторів може допомогти, але тільки якщо радіатор має достатню площу, щоб дозволити цим вентиляторам «лежати».

Надійність: більше частин, інші сценарії відмов

Зі збільшенням кількості вентиляторів ви отримуєте більше рухомих частин і більше проводки. Це не автоматично гірше; це змінює модель відмов.
Якщо один вентилятор відмовить у тривентиляторній конструкції, ви можете ще довго уникати негайного тротлінгу — доти, доки пил не заб’є ребра і не підніметься навколишня температура.
Двохвентиляторні рішення мають менше резерву, але простіше керуються.

Типові патерни надійності в полі

  • Часткова відмова вентилятора: один вентилятор застигає; температури піднімаються повільно; шум стає асиметричним; помічають це зазвичай влітку.
  • Неправильне читання тахометра: контролер думає, що вентилятор крутиться, хоча ні. Це рідше, але неприємно.
  • Падіння статичного тиску через пил: фільтри плюс ребра забиваються, вентилятори нарощують обороти, статичний тиск падає, температури ростуть.
  • Знос підшипників через постійні високі оберти: часто в маленькому швидкому вентиляторі в обмеженому кожусі двох вентиляторів.
  • Механічна напруга: важчі тривентиляторні карти провисають; PCIe-роз’єм і слот з часом відчувають неприємні сили.

У дата-центрах корисність резерву важлива. У десктопах править предсказуваність. Передбачуваність приходить із охолоджувачем, який
не потребує героїчних 80–100% обертів вентилятора, щоб триматися поза тротлінгом.

Одна цитата, ретельно підібрана і насправді доречна: «Надія — не стратегія.» —Gordon R. Sullivan

У застосуванні до охолодження: не сподівайтесь, що третій вентилятор врятує вас у корпусі з поганим впуском. Виправте бюджет повітря перш ніж покладатися на резерви.

Форм-фактор: довжина, провисання, зазори та конфлікти повітряного потоку

Тривентиляторні конструкції зазвичай довші, іноді вищі й часто важчі. Це важливо з трьох причин:

  1. Зазор: фронтальні радіатори, корзини для накопичувачів і пучки кабелів стають блокаторами потоку.
  2. Повітряний шлях: GPU стає стіною, яка може задушити нижній впуск або порушити фронтально-назадній потік.
  3. Механічна стабільність: провисання може погіршити тиск контакту з часом, особливо якщо охолоджувач гнеться.

Я бачив, як покупки «кращого охолодження» перетворювалися на гірші температури, бо довша карта стояла в 8 мм від фронтальних впускних вентиляторів.
Вентилятори не тягнули повітря; вони тягнули розчарування.

Open-air vs blower vs server-style front-to-back

Більшість споживчих 2-вентиляторних і 3-вентиляторних GPU — open-air: вони викидають тепло в корпус. Якщо повітряний потік корпусу дисциплінований, це нормально.
Якщо ні — виникає петля зворотного зв’язку: GPU нагріває корпус, корпус нагріває GPU, і єдиний переможець — пил.
Бловери й серверні фронт-назадні дизайни виштовхують гаряче повітря назад або по визначеному шляху. Вони голосніші, але передбачувані.

Якщо ви запускаєте тривалі обчислення (рендеринг, навчання ML, ферми компіляції), передбачуваний вихід коштує грошей. Якщо ви граєте з пристойним корпусом, open-air зазвичай підходить — просто не вважайте корпус за опціональний аксесуар.

Цікаві факти та коротка історія (8 пунктів)

  1. Ранні ПК-GPU часто покладалися на пасивні радіатори; кулери з вентиляторами стали поширеними, коли щільність потужності зросла наприкінці 1990-х — початку 2000-х.
  2. Випарні камери перейшли з ніші/серверного охолодження в масові GPU-кулери, коли тепловий потік виріс і контроль гарячих точок став важливішим за середню температуру.
  3. Сенсори hotspot (junction) стали широкодоступними користувачам лише в останні кілька років, змінюючи уявлення про «хороше охолодження».
  4. Статичний тиск став загальнопопулярною темою, головно через радіатори і щільні стоси ребер, що виявили межі вентиляторів з високим CFM але низьким тиском.
  5. Осьові вентиляторні GPU-кулери (open-air) захопили споживчий ринок, бо при однаковому тепловому навантаженні можуть бути тихішими ніж бловери — за умови, що корпус може вивести тепло.
  6. Режими зупинки вентиляторів (0 RPM на холості) стали очікуваною сучасною опцією; старі конструкції крутилися постійно, що іноді покращувало стабільність VRM і пам’яті в теплих корпусах.
  7. Якість і товщина термопрокладок стали першочерговим конструктивним обмеженням, оскільки потужності пам’яті та VRM зросли; погана компресія прокладок може створити парадоксальні результати (холодний GPU, перегріта пам’ять).
  8. Тривентиляторні макети часто з’являються тому, що довжина PCB і радіатора зросла; третій вентилятор часто дає покриття, а не додаткову здатність охолоджувати на мм.

Три корпоративні міні-історії з практики

1) Інцидент через хибне припущення: «Три вентилятори означають більший потік»

Середня компанія розгорнула партію робочих станцій з GPU для нічного рендерингу. Закупівля обрала тривентиляторну модель, бо вона виглядала «преміально»
і була тихішою в оглядах. Корпуси, проте, залишилися старі середні тури з декоративною передньою панеллю і пиловим фільтром, що міг зупинити маленького птаха.

Перший тиждень пройшов непогано, бо зовнішня температура була м’якою, а завдання короткими. Потім трапився довший рендер: тривалі години на 100% GPU.
Температури підповзли, частоти почали пилятися, і час виконання завдань став непередбачуваним. Підтримка отримала тікети: «нові машини гірше старих».

Хибне припущення було простим: три вентилятори означають, що GPU буде в порядку незалежно від повітряного потоку корпусу. Насправді тривентиляторна
конструкція була оптимізована для відкритого стенду. Всередині обмеженого корпусу вентилятори тягнули проти слабкого впуску і рециркулювали тепле повітря.
Третій вентилятор в основному перерозподіляв тепло всередині кожуха, ніби високооплачуваний стажер переносив коробки між двома полицями.

Рішення не було екзотичним: прибрали обмежувальний фронтальний вставний елемент, поставили впускні вентилятори з вищим статичним тиском і
стандартизували криві вентиляторів, щоб тримати невеликий позитивний тиск. Раптом частоти стабілізувалися. «Преміальний» став правдою — після того як бюджет повітря було приведено в дію.

2) Оптимізація, що відкотилася: тихіша крива вентиляторів, гарячіша пам’ять

Інша команда запускала інференс-навантеження на споживчих GPU у лабораторії. Хтось налаштував криву вентиляторів GPU, щоб мінімізувати шум під час денних демонстрацій.
Крайові температури GPU лишалися в межах цілі, тому зміни визнали успіхом.

Через два місяці почали з’являтися періодичні помилки — не фатальні, але неприємні. Шаблон виглядав як програмна помилка, поки інженер не зв’язав сплески помилок з теплими днями і довшими прогонами.
Температура пам’яті виявилася причиною.

Оптимізація відкотилася, бо тихіша крива зменшила потік повітря над областю пам’яті і VRM. Багато охолоджувачів розраховані на «мито» вентиляторів над PCB, а не тільки над стосом ребер.
Нижчі оберти підтримували ядро GPU в порядку, тоді як пам’ять повільно «підсмажувалася». Система була стабільною — до моменту, коли перестала бути такою.

Виправлення було дисциплінованим: додали моніторинг температур пам’яті/VRM, ввели мінімум обертів вентиляторів під тривалим навантаженням і валідировали годинний soak-тест замість п’ятихвилинної демонстрації.
Вони отримали трохи більше шуму і значно менше таємничих помилок.

3) Нудна, але правильна практика, що врятувала ситуацію: повітряний потік корпусу як контрольована змінна

Фінансова організація (так, справді) запускала важкі обчислення ризиків уночі на невеликому локальному кластері. Їхнє оновлення апаратури включало суміш двовентиляторних і тривентиляторних GPU від різних постачальників — бо ланцюги постачань люблять практичні жарти.

SRE, що керував кластером, зробив нудну річ: стандартизував розміщення корпусних вентиляторів, закріпив кабельні шляхи, зафіксував температуру навколишнього середовища і ввів політику, що будь-який вузол має пройти 30-хвилинний тест з заданими кривими вентиляторів перед підключенням до пулу. Це не було захопливо. Це також стало причиною, чому кластер не розплавився під час хвилі спеки.

Коли температура навколишнього піднімалась, вузли поводилися передбачувано. Тривентиляторні карти працювали на нижчих обертах, двовентиляторні працювали гучніше, але жодна не впала в хаотичний тротлінг. Нудна практика — поводитися з повітряним потоком як з інфраструктурою, а не враженням — спрацювала.

Пізніше, коли один вентилятор GPU частково відмовив, дашборди зафіксували аномалію тахометра і температурний перепад за хвилини. Вузол було вивантажено й відремонтовано до інциденту. Ніхто не писав героїчного постмортему. Ось це і є суть.

Практичні завдання: команди, виходи та рішення (12+)

Це польові завдання. Не бенчмарки для хвастощів. Кожне завдання включає: команду, що означає вихід, і рішення, яке з цього випливає. Приклади припускають Linux. Якщо ви на Windows, транслюйте сенс, а не синтаксис.

Завдання 1: Ідентифікувати модель GPU і драйвер

cr0x@server:~$ lspci -nn | grep -Ei 'vga|3d|display'
01:00.0 VGA compatible controller [0300]: NVIDIA Corporation GA104 [GeForce RTX 3070] [10de:2484] (rev a1)

Значення: Підтверджує точний ASIC GPU і PCI ID. Корисно, коли варіанти охолоджувачів відрізняються по SKU.

Рішення: Якщо модель не та, що ви очікували, зупиніться. Не налаштовуйте криву вентиляторів для неправильного обладнання.

Завдання 2: Прочитати живі температури GPU, потужність і оберти (NVIDIA)

cr0x@server:~$ nvidia-smi --query-gpu=timestamp,name,temperature.gpu,temperature.memory,power.draw,fan.speed,clocks.sm,clocks.mem --format=csv
timestamp, name, temperature.gpu, temperature.memory, power.draw, fan.speed, clocks.sm, clocks.mem
2026/01/21 12:10:44, NVIDIA GeForce RTX 3070, 71, 86, 198.34 W, 58 %, 1785 MHz, 7001 MHz

Значення: Ядро 71°C, пам’ять 86°C, вентилятори 58%, потужність ~198W. Ця цифра пам’яті має значення.

Рішення: Якщо температура пам’яті близька до межі при тривалому навантаженні, надавайте пріоритет повітряному потоку та перевірці прокладок/контакту замість додавання ще одного вентилятора.

Завдання 3: Зчитати телеметрію сенсорів AMD GPU (amdgpu)

cr0x@server:~$ sudo sensors | sed -n '/amdgpu/,+20p'
amdgpu-pci-0d00
Adapter: PCI adapter
vddgfx:      0.95 V
edge:        +68.0°C
junction:    +92.0°C
mem:         +84.0°C
power1:     210.00 W  (cap = 250.00 W)

Значення: Junction 92°C при edge 68°C: великий перепад. Зазвичай це контакт/розподіл тепла, а не повітряний потік.

Рішення: Якщо перепад junction-to-edge стабільно великий, перевірте тиск кріплення, пасту, товщину прокладок і плоскост bази перед зміною кількості вентиляторів.

Завдання 4: Перевірити контекст системних температур CPU і NVMe (не звинувачуйте GPU через гарячий корпус)

cr0x@server:~$ sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +84.0°C
Core 0:        +82.0°C
Core 1:        +80.0°C

nvme-pci-0200
Adapter: PCI adapter
Composite:    +74.9°C  (low  =  -0.1°C, high = +84.8°C)

Значення: Пакет CPU і NVMe теж гарячі. Це проблема повітряного потоку корпусу/навколишньої температури, а не «2 проти 3 вентиляторів GPU».

Рішення: Виправте баланс впуску/виходу і пилові фільтри перед тим, як міняти охолоджувач GPU.

Завдання 5: Перевірити пристрої вентиляторів і доступність PWM-контролю

cr0x@server:~$ ls /sys/class/hwmon/
hwmon0  hwmon1  hwmon2
cr0x@server:~$ for h in /sys/class/hwmon/hwmon*; do echo "== $h =="; cat $h/name; done
== /sys/class/hwmon/hwmon0 ==
coretemp
== /sys/class/hwmon/hwmon1 ==
nvidia
== /sys/class/hwmon/hwmon2 ==
nct6798

Значення: У вас є контролер материнської плати (nct6798) і вузол hwmon для GPU.

Рішення: Якщо контролер вентилятора на материнській платі відсутній або неправильно визначений, ви не зможете надійно координувати корпусні вентилятори з поведінкою GPU — очікуйте проблем з рециркуляцією.

Завдання 6: Підтвердити оберти корпусних вентиляторів (під контролем материнської плати)

cr0x@server:~$ for f in /sys/class/hwmon/hwmon2/fan*_input; do echo "$f: $(cat $f) RPM"; done
/sys/class/hwmon/hwmon2/fan1_input: 920 RPM
/sys/class/hwmon/hwmon2/fan2_input: 880 RPM
/sys/class/hwmon/hwmon2/fan3_input: 0 RPM

Значення: fan3 показує 0 RPM — або зупинений (навмисно), або відмовив/відключений.

Рішення: Якщо впускний/вихідний вентилятор мертвий, тривентиляторний охолоджувач GPU не компенсує це. Виправте/замініть перед налаштуванням вентиляторів GPU.

Завдання 7: Виявити сигнали термального тротлінгу (NVIDIA)

cr0x@server:~$ nvidia-smi -q -d PERFORMANCE | sed -n '/Clocks Throttle Reasons/,+30p'
Clocks Throttle Reasons
    Idle                          : Not Active
    Applications Clocks Setting   : Not Active
    SW Power Cap                  : Not Active
    HW Slowdown                   : Active
    HW Thermal Slowdown           : Active
    HW Power Brake Slowdown       : Not Active

Значення: Thermal slowdown активний. Ви не «трохи гарячі», вас регулюють.

Рішення: Припиніть ганятися за кількістю вентиляторів. Вирішіть корінь: контакт радіатора, обмеження повітряного потоку, пил або ліміт потужності. Потім протестуйте знову.

Завдання 8: Швидка перевірка повітряного потоку корпусу через проксі тиску (направлення вентиляторів і дельта оборотів)

cr0x@server:~$ grep -H . /sys/class/hwmon/hwmon2/fan*_input
/sys/class/hwmon/hwmon2/fan1_input:920
/sys/class/hwmon/hwmon2/fan2_input:880
/sys/class/hwmon/hwmon2/fan3_input:0

Значення: Два вентилятори крутяться ~900 RPM, один зупинений. Якщо ті два — переважно витяжка, а впуск слабкий, GPU буде рециркулювати тепло.

Рішення: Забезпечте принаймні один потужний шлях впуску. Якщо у вас передня панель обмежує потік, розгляньте впускні вентилятори з вищим тиском і приберіть перешкоди.

Завдання 9: Логувати температури з часом під навантаженням, щоб вловити нарощування та нестабільність

cr0x@server:~$ nvidia-smi --query-gpu=timestamp,temperature.gpu,temperature.memory,fan.speed,power.draw,clocks.sm --format=csv -l 2 | head -n 8
timestamp, temperature.gpu, temperature.memory, fan.speed, power.draw, clocks.sm
2026/01/21 12:20:10, 62, 78, 42 %, 185.12 W, 1830 MHz
2026/01/21 12:20:12, 65, 80, 47 %, 195.44 W, 1815 MHz
2026/01/21 12:20:14, 69, 83, 55 %, 201.02 W, 1740 MHz
2026/01/21 12:20:16, 71, 85, 60 %, 203.11 W, 1695 MHz
2026/01/21 12:20:18, 70, 86, 63 %, 199.87 W, 1725 MHz
2026/01/21 12:20:20, 72, 86, 67 %, 205.22 W, 1665 MHz

Значення: Вентилятори агресивно нарощують обороти; частоти коливаються. Така осциляція зазвичай означає, що ви близько до теплового порогу або ліміту потужності.

Рішення: Стабілізуйте трохи вищою мінімальною швидкістю вентилятора і кращою витяжкою корпусу, або знизьте ціль потужності. Не розраховуйте на «більше вентиляторів», не вирішивши пороги.

Завдання 10: Виміряти, чи GPU позбавлений свіжого повітря (тест без панелі)

cr0x@server:~$ nvidia-smi --query-gpu=temperature.gpu,temperature.memory,fan.speed --format=csv
temperature.gpu, temperature.memory, fan.speed
73, 92, 74 %
cr0x@server:~$ echo "Remove side panel, wait 5 minutes under the same load, then rerun nvidia-smi"
Remove side panel, wait 5 minutes under the same load, then rerun nvidia-smi
cr0x@server:~$ nvidia-smi --query-gpu=temperature.gpu,temperature.memory,fan.speed --format=csv
temperature.gpu, temperature.memory, fan.speed
66, 84, 58 %

Значення: Велике покращення з відкритою панеллю: вузьке місце — повітряний потік корпусу.

Рішення: Інвестуйте в налаштування впуску/витяжки. Третій вентилятор на GPU допоможе менше, ніж надання реального повітря поточним вентиляторам.

Завдання 11: Перевірити правильні помилки PCIe (іноді тепло й сумісність сигналу корелюють)

cr0x@server:~$ sudo dmesg -T | grep -Ei 'pcie|aer|nvme|amdgpu|nvrm' | tail -n 10
[Tue Jan 21 12:22:01 2026] pcieport 0000:00:01.0: AER: Corrected error received: 0000:01:00.0
[Tue Jan 21 12:22:01 2026] pcieport 0000:00:01.0: AER: PCIe Bus Error: severity=Corrected, type=Physical Layer
[Tue Jan 21 12:22:01 2026] pcieport 0000:00:01.0: AER: device [8086:460d] error status/mask=00000001/00002000

Значення: Скориговані помилки фізичного рівня. Не завжди термічні, але тепло може погіршити маргінальну цілісність сигналу, особливо при провисанні або поганому сідінні карти.

Рішення: Перевірте посадку GPU, додайте опору для важких тривентиляторних карт, підтвердіть надійність PCIe живлення й протестуйте після термостабілізації.

Завдання 12: Підтвердити політику керування системними вентиляторами (сервісний рівень systemd)

cr0x@server:~$ systemctl status fancontrol --no-pager
● fancontrol.service - fan speed regulator
     Loaded: loaded (/lib/systemd/system/fancontrol.service; enabled)
     Active: active (running) since Tue 2026-01-21 11:55:09 UTC; 35min ago

Значення: Fancontrol активний. Добре: послідовну поведінку корпусних вентиляторів можна забезпечити.

Рішення: Якщо fancontrol (або BIOS-криві вентиляторів) нерівномірні по машинах, виправте це перед порівнянням 2-вентиляторних і 3-вентиляторних рішень.

Завдання 13: Перевірити, що ваше навантаження — реальний драйвер температур (а не фоновий процес)

cr0x@server:~$ top -b -n 1 | head -n 12
top - 12:25:10 up 12 days,  4:10,  1 user,  load average: 6.92, 6.40, 5.88
Tasks: 312 total,   2 running, 310 sleeping,   0 stopped,   0 zombie
%Cpu(s): 18.2 us,  3.1 sy,  0.0 ni, 78.0 id,  0.2 wa,  0.0 hi,  0.5 si,  0.0 st
MiB Mem :  64246.5 total,   8123.2 free,  31244.8 used,  24878.5 buff/cache
PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
8812 cr0x      20   0  9728m  812m  302m R  165.0   1.3   2:11.42 python

Значення: Завантаження CPU помірне; якщо GPU гарячий, швидше за все через навантаження на GPU, а не через нагрів корпуса від CPU.

Рішення: Якщо CPU завантажений і сильно виділяє тепло, розглядайте повітряний потік корпусу в цілому; тривентиляторний охолоджувач GPU може лише компенсувати проблему процесорного кулера.

Завдання 14: Швидко перевірити вплив пилу (практична різниця фільтра)

cr0x@server:~$ echo "Inspect and clean front dust filter; then compare steady-state fan.speed and temperature at identical load."
Inspect and clean front dust filter; then compare steady-state fan.speed and temperature at identical load.
cr0x@server:~$ nvidia-smi --query-gpu=temperature.gpu,fan.speed,power.draw --format=csv
temperature.gpu, fan.speed, power.draw
70, 64 %, 200.11 W

Значення: Використайте це як базову лінію перед чисткою. Після чистки бажано бачити нижчі обороти при тій же температурі — або нижчу температуру при тих же оборотах.

Рішення: Якщо чищення дає відчутне покращення, ваш вузький профіль — це обмеження і обслуговування, а не питання 2 проти 3 вентиляторів.

Швидкий план діагностики

Коли хтось питає «має купити 3-вентиляторну версію?», вони часто питають «чому моя система гаряча/гучна/тротлить?»
Ось найкоротший шлях до реальної відповіді.

Перше: визначте, який тип теплової проблеми у вас (2 хвилини)

  1. Перевірте температуру ядра, hotspot/junction, температуру пам’яті, навантаження вентиляторів і споживання енергії під реальним навантаженням (не хвилинний спік).
  2. Пошукайте прапори тротлінгу (thermal slowdown активний, частоти коливаються).
  3. Шукайте дельти: junction vs edge; пам’ять vs ядро; GPU vs CPU/NVMe температури.

Якщо тільки hotspot/junction поганий: проблема контакту/розподілу тепла. Якщо все гаряче: проблема повітряного потоку/навколишнього/обмеження.
Якщо температури нормальні, але шум жахливий: проблема з кривою вентиляторів/тиском/резонансом.

Друге: ізолюйте корпус як вузьке місце (5 хвилин)

  1. Тест без бічної панелі (зберігайте те саме навантаження і умови в кімнаті наскільки можливо).
  2. Перевірте перешкоди впуску: пиловий фільтр, передня панель, пучки кабелів.
  3. Підтвердьте оберти корпусних вентиляторів: чи дійсно впуски обертаються? Чи витяжки переважають впуски?

Якщо відкриття панелі значно покращує температуру і знижує навантаження вентиляторів, не сперечайтесь про кількість вентиляторів. Вам потрібен кращий баланс впуск/витяжка.

Третє: вирішити, чи потрібен «більший охолоджувач» (10 хвилин + трохи чесності)

  1. Наскільки навантаження тривале? Якщо це короткі сплески, вам може бути потрібна краща крива, а не більший охолоджувач.
  2. Яка у вас температура навколишнього середовища? Якщо у вас тепла кімната, більша площа радіатора (часто у 3-вентиляторних моделях) допомагає.
  3. Чи маленький у вас корпус або ворожий до повітряного потоку? Якщо так, віддавайте перевагу передбачуваному виводу повітря (або виправте корпус) замість open-air «героїки».
  4. Чи є температура пам’яті/VRM реальним обмеженням? Якщо так, обирайте дизайн, відомий хорошим тиском на прокладки і потоком повітря по PCB.

Типові помилки: симптом → корінь проблеми → виправлення

1) Симптом: температура ядра GPU в порядку, але hotspot/junction дуже висока

Корінь проблеми: Поганий контакт, нерівномірний тиск кріплення, деформована база, деградована паста або неправильне розподілення випарної камери.

Виправлення: Пересадіть охолоджувач (якщо підтримується), замініть пасту правильним нанесенням, перевірте товщину прокладок і патерн затягування. Якщо карта на гарантії — RMA замість домашніх героїчних дій на новому пристрої.

2) Симптом: температура пам’яті повільно піднімається з часом, тоді як ядро стабільне

Корінь проблеми: Крива вентиляторів оптимізована під ядро, недостатній потік повітря над модулями пам’яті/VRM або стиснуті/невірні прокладки.

Виправлення: Моніторьте температури пам’яті, забезпечте мінімум обертів вентиляторів при тривалому навантаженні і переконайтесь, що повітря миє область PCB. Якщо ви змінювали прокладки — перевірте товщину і компресію.

3) Симптом: тривентиляторний GPU голосніший за двовентиляторний

Корінь проблеми: Агресивне нарощення обертів, резонанс від довшого кожуха, турбулентність через тісні зазори або тональні взаємодії між вентиляторами.

Виправлення: Згладьте криву вентиляторів (повільніше нарощення), покращіть зазори впуску, додайте демпфування (закріпіть панелі, кабелі) і впевніться, що корпусні вентилятори не створюють конфлікту тисків.

4) Симптом: температури значно покращуються при відкритій бічній панелі

Корінь проблеми: Обмеження впуску, негативний тиск, що спричинює рециркуляцію гарячого повітря, або заблокований шлях виходу.

Виправлення: Покращіть впуск (вентилятори з більшим тиском, менш обмежувальна передня панель), почистіть фільтри, акуратно прокладіть кабелі і збалансуйте впуск/витяжку. Не купуйте третій вентилятор GPU, щоб компенсувати корпус, який не може дихати.

5) Симптом: вентилятори постійно нарощують та знижують обороти; частоти коливаються

Корінь проблеми: Контрольна петля занадто реактивна; пороги поруч із тепловими або потужнісними лімітами; непослідовний повітряний потік корпусу створює фідбек.

Виправлення: Додайте гістерезис (або згладжену криву), трохи підвищте мінімальні оберти вентилятора або знизьте ціль потужності. Підтвердьте стійкий вихід повітря.

6) Симптом: один вентилятор періодично показує 0 RPM

Корінь проблеми: Знос підшипника, незакріплений конектор, проблема контролера або некоректний режим зупинки вентиляторів.

Виправлення: Перевірте, чи 0 RPM очікуваний при цій температурі. Якщо ні — розглядайте як апаратний дефект і відремонтуйте/замініть. Більша кількість вентиляторів не робить ігнорування дефектів безпечнішим.

7) Симптом: система стабільна взимку, нестабільна влітку

Корінь проблеми: Відсутність теплового запасу; конструкція охолодження працює на межі; накопичення пилу плюс вища навколишня температура.

Виправлення: Плануйте під найгірший випадок навколишньої температури, а не під сьогоднішню погоду. Чистіть регулярно, налаштуйте криві під тривалі навантаження і обирайте більші радіатори, якщо не можете контролювати оточення.

8) Симптом: після переходу на тихішу криву з’явилися помилки під навантаженням

Корінь проблеми: Перегрів VRM/пам’яті або нестабільність живлення, що не відстежується «температурою GPU».

Виправлення: Додайте моніторинг для сенсорів пам’яті і VRM, де доступно; валідируйте зміни за допомогою тривалих soak-тестів; встановіть мінімальний рівень повітряного потоку.

Другий жарт (і останній, який ви отримаєте): Термопаста — не рисова деталь вашої особистості — припиніть виражатися нею.

Перевірочні списки / покроковий план

Покроково: вибір між 2-вентиляторним і 3-вентиляторним дизайном

  1. Визначте навантаження: ігри з короткими піками? тривалий рендеринг? 24/7 обчислення? Від цього залежить правильний охолоджувач.
  2. Визначте навколишню температуру: типова і гірша. Тривалі 28–32°C — це інша ліга.
  3. Зміряйте реальний повітряний потік вашого корпусу: кількість впусків, фільтри, обмеження панелей і шлях виходу.
  4. Зверніть увагу на масу радіатора і площу ребер, а не на кількість вентиляторів. Кількість вентиляторів — видима маркетингова частина.
  5. Пріоритет для охолодження пам’яті/VRM, якщо ваше навантаження пам’ятево- або енергомістке.
  6. Перевірте фізичні обмеження: довжина, товщина, зазор від фронтальних вентиляторів/радіаторів і радіус вигину кабелів.
  7. План обслуговування: якщо чистка від пилу рідкість у вашому середовищі, віддавайте перевагу дизайнам, що терпимі до обмежень (або виправте середовище).
  8. Визначте політику шуму: стабільний шум краще за коливання. Налаштуйте на стабільність.

Покроково: змусити працювати будь-який охолоджувач (2- або 3-вентиляторний)

  1. Базова телеметрія: логуйте температури (ядро/hotspot/пам’ять), оберти вентиляторів, потужність і частоти протягом 15 хвилин під реальним навантаженням.
  2. A/B тест без панелі: якщо значно покращується — виправляйте повітряний потік корпусу спочатку.
  3. Чищення фільтрів і ребер: усуньте обмеження. Повторно протестуйте базову лінію.
  4. Згладжування кривої вентиляторів: зменшіть різкі нарощення; встановіть мінімум оборотів для стабільності пам’яті/VRM.
  5. Санітет цілі потужності: якщо ви досягаєте thermal slowdown, невелике зниження потужності може дати велику стабільність з малою втратою продуктивності.
  6. Механічна перевірка: упевніться, що карта підпирається; мінімізуйте провисання; перевірте підключення живлення.
  7. Soak-тест: одна година, а не п’ять хвилин. Теплова рівновага — повільна обманниця.

Операційний чеклист: що стандартизувати в флоті

  • Розміщення корпусних вентиляторів і напрямок (задокументуйте; не дозволяйте кожному збирачеві імпровізувати).
  • Політика керування вентиляторами (BIOS-криві або сервіс fancontrol) і мінімальні RPM.
  • Дашборди телеметрії для ядра/hotspot/пам’яті і прапорів тротлінгу.
  • Графік обслуговування фільтрів і радіаторів (особливо якщо позитивний тиск не підтримується).
  • Тест прийняття: стабільність температур при тривалому навантаженні і відсутність тротлінгу.

Питання й відповіді (FAQ)

1) Чи завжди 3-вентиляторний кулер холодніший за 2-вентиляторний?

Ні. Часто так, бо він зазвичай має більший радіатор. Але сама кількість вентиляторів не гарантує кращого результату.
Добре спроектований 2-вентиляторний кулер з хорошим контактом і достатньою площею ребер може обіграти посередній 3-вентиляторний дизайн.

2) Чому деякі 3-вентиляторні GPU в моєму корпусі гарячіші за мою стару 2-вентиляторну карту?

Тому що нова карта ймовірно віддає більше тепла в корпус (вищий TDP) і може бути довшою, перекриваючи шляхи впуску. Також охолоджувач може залежати від ненагромадженого впуску.
Зробіть тест без панелі; якщо це покращує ситуацію, обмеження корпусу — ваш ліміт.

3) Що важливіше: кількість вентиляторів чи розмір радіатора?

Розмір радіатора і розподіл тепла. Вентилятори відводять тепло з ребер; вони не створюють площу ребер. Якщо радіатор недостатній, більше вентиляторів просто рухатимуть тепле повітря швидше.

4) Чи більше вентиляторів означає більший статичний тиск?

Не обов’язково. Тиск — це функція дизайну вентилятора і обертів, а не тільки кількості. Три низькотискові вентилятори все ще можуть боротися з щільним стосом ребер і запиленим фільтром.

5) Що пріоритетніше: температура junction/hotspot чи середня температура GPU?

Для стабільності hotspot/junction частіше передбачає тротлінг і довгострокове навантаження краще, ніж середня. Великі дельти hotspot вказують на проблему контакту/розподілу тепла, яку кількість вентиляторів не вирішить.

6) Чи 2-вентиляторні дизайни кращі для малих корпусів?

Іноді, бо вони коротші і залишають корпус більш «дихаючим». Але малі корпуси також карають поганий витік і обмежені впуски. Якщо ви не можете гарантувати повітряний потік, розгляньте дизайни з передбачуваним виводом повітря, а не лише меншу кількість вентиляторів.

7) Якщо один вентилятор відмовить, чи тривентиляторний GPU безпечніший?

Він може бути більш терпимим у короткостроковій перспективі, але й дає вам більше речей, які можуть відмовити. «Безпечнішою» є система, яка моніторить обороти вентиляторів і температури і реагує до того, як тротлінг стане приводом для інциденту.

8) Чому мій GPU голосно працює, хоча температури не такі вже й високі?

Бо крива вентиляторів може бути агресивною, налаштованою на контроль заголовкових температур більше, ніж акустики. Також турбулентність і резонанс можуть зробити середні оберти дуже гучними. Згладьте криву і усуньте обмеження, щоб вентилятори не мусили лавинно нарощувати обороти.

9) Чи є зниження напруги або зменшення цілі потужності дійсною альтернативою купівлі 3-вентиляторної моделі?

Так, часто. Багато GPU дозволяють знизити споживання помітно з мінімальною втратою продуктивності, що зменшує теплове джерело. Це покращує стабільність більш надійно, ніж додаткові вентилятори, особливо в корпусах з обмеженим потоком повітря.

10) Чи допомагають три вентилятори в охолодженні VRM і пам’яті?

Можуть, але тільки якщо кожух і розташування ребер спрямовують потік повітря над цими компонентами. Деякі охолоджувачі фокусуються на головному стосі ребер і залишають пам’ять/VRM залежними від випадкового потоку. Завжди перевіряйте температури пам’яті під тривалим навантаженням.

Наступні кроки, які вам справді варто зробити

Якщо ви купуєте: не купуйте кількість вентиляторів. Купуйте тепловий запас і передбачувану поведінку. 3-вентиляторний дизайн часто є проксі для більшого радіатора і менше шуму при заданому навантаженні — але він також може означати «потребує великого корпусу і хорошого впуску».

Якщо ви діагностуєте: виконайте швидкий план. Логуйте ядро/hotspot/пам’ять і прапори тротлінгу під реальним тривалим навантаженням.
Зробіть A/B тест без панелі. Якщо це змінює все — корпусний потік винен. Якщо виділяється перепад hotspot — припиніть підганяти кількість вентиляторів і перевірте контакт і розподіл тепла.

Практичні дії на наступну годину:

  • Захопіть 15-хвилинний лог температур/потужності/обертів під реальним навантаженням.
  • Зробіть A/B тест без бічної панелі, щоб класифікувати вузьке місце.
  • Перевірте, чи є вентилятори з 0 RPM, які не повинні бути такими.
  • Очистіть фільтри і переконайтесь, що впуск не задушений.
  • Згладьте криву вентиляторів, щоб зменшити осциляцію і захистити пам’ять/VRM мінімальним обертом.

Потім прийміть рішення: якщо ваш вузький профіль — площа ребер і у вас є зазор у корпусі і хороший впуск, добре спроектований 3-вентиляторний кулер може дати тихішу роботу і більше стабільності.
Якщо ж вузьке місце — обмеження повітряного потоку або якість контакту, третій вентилятор — просто гучніший спосіб дізнатися ту саму істину.

← Попередня
recordsize в ZFS: параметр, що визначає 80% продуктивності файлів
Наступна →
Мега-меню на CSS Grid: наведення, фокус, мобільні пристрої та основи доступності

Залишити коментар