TGP у ноутбуках: число, яке бренди люблять приховувати

Було корисно?

Хтось у вашій команді купує «модель RTX», кошторис погоджують, коробка приходить, і потім бенчмарки лягають кубиками. Та ж назва GPU, ті ж маркетингові пункти, але працює він так, наче біжить з парашутом.

Той «парашут» зазвичай — TGP: Total Graphics Power. Це бюджет потужності, який визначає, наскільки швидко GPU ноутбука може працювати довше кількох секунд. Вендори знають, що це важливо. Вони також знають, що це ламає акуратні продуктові лінійки. Тому часто ховають його, розмивають або ховають у трьох сносках.

TGP — справжній номер моделі

На десктопах «RTX 4070» означає щось відносно стабільне. У ноутбуках це більше схоже на родинне прізвище. Реальна людина, з якою ви зустрілися, — «RTX 4070 Laptop GPU at 140 W з MUX і пристойним охолодженням» або «RTX 4070 Laptop GPU at 60 W у тонкому корпусі, що віддає пріоритет тиші над фізикою». Це різні продукти під тим самим знаком.

TGP — це рамка потужності для пакета GPU (і іноді для пов’язаних ліній живлення). Вона диктує сталий частотний режим, стабільну поведінку пам’яті під навантаженням і наскільки агресивно система може бустити, коли CPU теж потребує енергії. Якщо ви працюєте з продуктивністю — SRE, розробник, дизайнер, дата-сайентист — важить лише стале поведінка. Імпульсні цифри — для слайдів на презентаціях.

Насправді TGP визначає:

  • Кількість кадрів і часи рендеру після перших 30–120 секунд.
  • Послідовність: підгальмовування, джиттер і «чому ця збірка повільніша о 14:00, ніж о 9:00?»
  • Шум вентиляторів і температура шкіри: бо потужність перетворюється на тепло, а тепло — на шум або тротлінг.
  • Поведінку батареї: вищі цільові потужності часто означають більш агресивні переключення і гіршу стабільність при відключеному живленні.

Якщо винести одне правило: порівнюючи ноутбуки, ви порівнюєте системи охолодження та політики живлення принаймні так само, як і самі GPU.

TGP, TDP, TBP: що до чого і чому маркетинг любить плутанину

Ці абревіатури — ідеальний симбіоз «достатньо науково, щоб звучати серйозно» і «достатньо різні, щоб їх можна було використати для маніпуляції в техспеці». Ось практична мапа, яка працює в полі.

TGP (Total Graphics Power)

TGP — це визначений вендором бюджет потужності для GPU ноутбука. Зазвичай його накладають через прошивку й драйвери як ліміт потужності (іноді кілька лімітів: довготривалий, короткотривалий, піковий). Деякі платформи дозволяють додатковий запас через функції на кшталт NVIDIA Dynamic Boost, яка може перемістити бюджет від CPU до GPU за певних умов.

TDP (Thermal Design Power)

TDP — це число для планування теплового режиму. На CPU воно може позначати базовий рівень для тривалого споживання при базових частотах, а не обов’язково максимум. У маркетингу ноутбуків TDP іноді використовують вільно, коли насправді мають на увазі «якийсь ліміт потужності в цьому діапазоні». На нього не слід покладатися як на гарантію покупки.

TBP (Total Board Power)

На десктопах TBP часто включає всю відеокарту: GPU, VRAM, регулятори і іноді вентилятори. У ноутбуках TBP використовують менш послідовно. Деякі OEMи називають це «Maximum Graphics Power» або «GPU power» і розраховують, що ви будете вдавати, ніби це стандартний термін.

Що вас має цікавити при покупці або діагностиці: фактичне тривале споживання GPU під вашим робочим навантаженням і чи обмежує систему потужність, чи температура.

Одна фраза, яку я тримаю на внутрішньому моніторі у ментальному вигляді — перефразована ідея, яку часто приписують W. Edwards Deming: Якщо ви не можете виміряти — ви не можете покращити. Нехай атрибуція не ідеальна, сенс залишається: ви не виправите те, що відмовляєтеся спостерігати.

Як TGP перетворюється на FPS (і чому це нелінійно)

Більше ватів зазвичай означає більшу продуктивність, але це не пряма лінія. Ви побачите спадну віддачу через криві «напруга‑частота», вузькі місця пам’яті і теплове насичення. Корисна ментальна модель така:

  • Низькі діапазони TGP (наприклад, 45–80 Вт): GPU майже постійно обмежений потужністю. Продуктивність сильно масштабується з ватами. Це ті ноутбуки, де «та ж назва GPU» нічого не означає.
  • Середні діапазони TGP (наприклад, 90–115 Вт): масштабування триває, але починає згладжуватись. Якість охолодження стає визначальним фактором.
  • Високі діапазони TGP (наприклад, 125–175 Вт): покращення ще можливе, але ви платите шумом, теплом і іноді втратою портативності. Також CPU стає значнішою частиною продуктивності в іграх/воркстейшн‑сценаріях, особливо при високих FPS.

Також GPU ноутбука рідко працює самостійно. Він ділить термо‑ та енергетичну екосистему з:

  • поведінкою бусту CPU (PL1/PL2 у Intel, PPT/EDC/TDC у AMD, OEM‑обмеження на обох).
  • спільними тепловими трубками/випарною камерою: навантаження на CPU може прогріти шлях GPU і навпаки.
  • охолодження VRM: регулятори, що перегріваються, можуть викликати зниження потужності навіть якщо температура кристалу GPU здається «нормальною».
  • маршрутом дисплея: Optimus, Advanced Optimus, MUX‑перемикач і зовнішні моніторні шляхи можуть змінювати характеристики продуктивності та латентність.

Жарт №1: Маркетинг ноутбуків ставиться до ватажу як до вашої зарплати — ніколи не обговорюють публічно, і всі вважають, що він вищий за правду.

Чому бренди ховають TGP

Бо TGP руйнує упорядковану історію. Якщо вендор ясно вкаже «RTX 4070 (60 W)» поруч із «RTX 4070 (140 W)», частина покупців миттєво зрозуміє, що це не те саме, і деякі понизять тонкий модель до дешевшого GPU, що дає схожу продуктивність на нижчій потужності.

Є й практичні причини, чому OEMи починають хитрунити:

  • Потужність — «до»: Dynamic Boost і OEM‑режими змінюють ліміти залежно від температур, розміру адаптера і навантаження CPU. Публікувати одне число їм ризиковано.
  • Регінальна плутанина зі SKU: той самий корпус у двох регіонах може постачатися з різними прокладками охолодження, версіями BIOS або адаптерами живлення.
  • Акустичні цілі: деякі лінійки налаштовані на низький рівень шуму. Вони не хочуть писати «ця модель повільніша» жирним; вони хочуть «студійна тиша».

Як оператору вам не цікаво, чому це приховано. Вам важливо, що це приховано. Розглядайте прихований TGP як запах проблем у закупівлях.

Цікаві факти й історичний контекст

Це не просто тривіальна інформація. Вона пояснює, чому потужність GPU у ноутбуках стала таким хаосом.

  1. Рання бренд‑лінійка «Max‑Q» (кінець 2010‑х) намагалася сигналізувати про ефективніші варіанти GPU для ноутбуків, але реалізації у OEMів відрізнялися за частотами, тепловим режимом і шумом.
  2. Пізніше «Max‑Q» перестав бути окремим SKU і перетворився на набір технологій (керування енергоспоживанням, налаштування акустики), що ускладнило висновки покупців про ватаж.
  3. Ідентичні назви GPU використовувалися в широкому діапазоні ватажів у міру диверсифікації дизайнів ноутбуків: тонкі ультрабуки, ноутбуки для креаторів і десктоп‑замінники всі хотіли однаковий значок у продажах.
  4. Power‑shift у стилі Dynamic Boost став поширенішим, коли OEMи зрозуміли, що можуть торгуватися ресурсами CPU за ресурсами GPU в іграх — поки навантаження не зміниться і обмін не стане болючим.
  5. Адаптери живлення стали частиною продуктивності: система, що постачається з меншим адаптером, може обмежувати сумарне споживання CPU+GPU, навіть якщо охолодження могло б впоратися з більшим навантаженням.
  6. Випарні камери та рідкий метал допомогли деяким дизайнам утримувати вищі TGP, але вони також додали варіативності: якість збірки і довгострокові ефекти можуть змінювати результати.
  7. Маршрутизація дисплея (Optimus vs MUX) стала фактором продуктивності: куди йдуть кадри впливає на накладні витрати й латентність, особливо при високих частотах оновлення.
  8. Оновлення прошивки можуть змінювати ліміти потужності: OEMи іноді коригують криві вентиляторів і ліміти після релізу через повернення, скарги на шум або крайові ситуації з теплом.

Швидкий план діагностики

Якщо ноутбук із «хорошим GPU» відчувається повільним, не гадьте. Ви можете знайти вузьке місце менше ніж за 10 хвилин, якщо перевірите правильні речі у правильному порядку.

Перше: підтвердьте, що ви дійсно використовуєте шлях dGPU, який вважаєте

  • Чи додаток працює на дискретному GPU, а не на iGPU?
  • Чи внутрішній дисплей маршрутизований через iGPU (Optimus) і чи це додає витрат продуктивності/латентності?
  • Чи оновлення драйвера не скинуло налаштування «переважного GPU»?

Друге: визначте, чи ви обмежені по потужності або по температурі

  • Слідкуйте за споживанням GPU, частотами та температурою під тривалим навантаженням.
  • Якщо споживання потужності досягає жорсткої стелі при помірних температурах — це обмеження по потужності.
  • Якщо температура «приковує» показники і частоти падають — це термальний тротлінг або проблема з гарячою точкою/VRM.

Третє: ідентифікуйте, хто краде бюджет (CPU чи GPU)

  • Запустіть навантаження, що навантажує лише GPU, і лише CPU, а потім разом.
  • Якщо при комбінованому навантаженні споживання GPU падає — у вас спільний теплово‑енергетичний дизайн, де CPU «б’є» GPU.

Четверте: перевірте режими OEM і поведінку BIOS/EC

  • Режими «Silent», «Balanced» і «Performance» не декоративні. Вони часто змінюють TGP‑обмеження.
  • Деякі режими розблоковуються тільки при живленні від мережі з правильним адаптером.

П’яте: вирішіть, яке виправлення прийнятне

  • Якщо це провал закупівлі: повернення/обмін, інший SKU, інший корпус.
  • Якщо це помилка в експлуатації: драйвер, режим, пил, термопаста, крива вентилятора, план живлення.
  • Якщо це фізичне обмеження: прийняти або переробити вимогу (eGPU, десктоп, віддалений GPU).

Практичні завдання: команди, виводи й рішення

Це реальні, виконувані перевірки. Вони не теоретичні. Кожне завдання включає, на що ви дивитесь і яке рішення ухвалюєте. Приклади наведені для Linux. У Windows є еквівалентні інструменти, але Linux дозволяє бачити «проводку» без GUI‑інтерпретації.

Завдання 1: Виявити GPU і драйвер, який дійсно використовується

cr0x@server:~$ lspci -nn | egrep -i 'vga|3d|display'
00:02.0 VGA compatible controller [0300]: Intel Corporation Iris Xe Graphics [8086:9a49]
01:00.0 3D controller [0302]: NVIDIA Corporation AD106M [GeForce RTX 4070 Laptop GPU] [10de:2820]

Що це означає: У вас є iGPU і NVIDIA dGPU. dGPU присутній на PCIe і має бути доступним.

Рішення: Продовжуйте. Якщо dGPU не виводиться, то це проблема налаштувань BIOS, відсутності пристрою або апаратна несправність — не загадка TGP.

Завдання 2: Підтвердити, що драйвер NVIDIA завантажено і GPU видно через NVML

cr0x@server:~$ nvidia-smi
Tue Jan 13 10:22:41 2026
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 555.58.02              Driver Version: 555.58.02      CUDA Version: 12.5     |
|-----------------------------------------+------------------------+----------------------|
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage   | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 4070 ...    Off | 00000000:01:00.0   Off |                  N/A |
| N/A   54C    P2              62W / 140W |   2210MiB /  8192MiB    |     43%      Default |
+-----------------------------------------+------------------------+----------------------+

Що це означає: NVML показує ліміт потужності 140 Вт. Це сильна підказка щодо сконфігурованого TGP‑стелі (або одного з них).

Рішення: Якщо Pwr:Usage/Cap показує щось на кшталт 50W / 60W для нібито високопродуктивної моделі — ви знайшли винуватця. Далі: перевірте, чи змінюється цей ліміт у різних режимах OEM, при підключенні адаптера чи через Dynamic Boost.

Завдання 3: Заміряти споживання і частоти в часі (стала поведінка)

cr0x@server:~$ nvidia-smi --query-gpu=timestamp,power.draw,power.limit,clocks.sm,clocks.mem,temperature.gpu,utilization.gpu --format=csv -l 2
timestamp, power.draw [W], power.limit [W], clocks.sm [MHz], clocks.mem [MHz], temperature.gpu, utilization.gpu [%]
2026/01/13 10:23:02, 118.45 W, 140.00 W, 2100 MHz, 8001 MHz, 72, 98 %
2026/01/13 10:23:04, 139.12 W, 140.00 W, 2235 MHz, 8001 MHz, 78, 99 %
2026/01/13 10:23:06, 139.87 W, 140.00 W, 2220 MHz, 8001 MHz, 79, 99 %

Що це означає: GPU насичується лімітом потужності, поки завантаження високе. Класична поведінка при обмеженні потужності.

Рішення: Якщо продуктивність низька і ви вперлися в невеликий ліміт потужності, ваші варіанти: змінити режим/BIOS, поліпшити охолодження (іноді це підвищує дозволену потужність) або прийняти, що SKU спроектовано для низького TGP.

Завдання 4: Перевірити маршрут дисплея Optimus/iGPU (поширений прихований податок)

cr0x@server:~$ xrandr --listproviders
Providers: number : 2
Provider 0: id: 0x43 cap: 0x9, Source Output, Sink Offload crtcs: 3 outputs: 5 associated providers: 1 name:modesetting
Provider 1: id: 0x1f3 cap: 0x2, Sink Output crtcs: 4 outputs: 4 associated providers: 1 name:NVIDIA-G0

Що це означає: Система ймовірно працює в гібридному режимі, де iGPU є основним провайдером дисплея, а NVIDIA GPU — пристрій для оффлоаду.

Рішення: Якщо вам потрібні максимальні FPS/мінімальна латентність — розгляньте можливість увімкнення MUX «тільки dGPU» (якщо доступно) або використовуйте зовнішній монітор, підключений до виходу dGPU.

Завдання 5: Підтвердити, який GPU рендерить конкретний процес (по процесу)

cr0x@server:~$ nvidia-smi pmon -c 1
# gpu        pid  type    sm   mem   enc   dec   jpg   ofa   command
    0      24819     G     78    12     0     0     0     0   blender

Що це означає: Процес дійсно використовує NVIDIA GPU (добре). Якщо ви не бачите нічого, ймовірно працюєте на iGPU або використовуєте CPU‑рендер.

Рішення: Якщо додаток не на dGPU, виправте налаштування додатка, змінні оточення або системні переваги GPU перед тим, як звинувачувати TGP.

Завдання 6: Подивитися, чи керування живленням фіксує стани продуктивності

cr0x@server:~$ nvidia-smi --query-gpu=pstate,clocks.sm,clocks.gr,clocks.mem --format=csv
pstate, clocks.sm [MHz], clocks.gr [MHz], clocks.mem [MHz]
P2, 2100 MHz, 2100 MHz, 8001 MHz

Що це означає: Багато ноутбучних GPU знаходяться в P2 під обчислювальним навантаженням; P0 — поширений у іграх/графіці. Не панікуйте лише через відсутність P0, але слідкуйте за частотами і завантаженням.

Рішення: Якщо ви застрягли в низькому P‑стані з низькими частотами при високому використанні, це може вказувати на політику обмеження, проблему драйвера або роботу від батареї/тихий режим.

Завдання 7: Перевірити адаптер живлення та обмеження блоку живлення (мовчазний обмежувач)

cr0x@server:~$ upower -d | sed -n '/line-power/,/Device/p'
Device: /org/freedesktop/UPower/devices/line_power_AC
  native-path:          AC
  power supply:         yes
  online:               yes
  has history:          no
  has statistics:       no

Що це означає: Машина бачить живлення від мережі. Деякі OEMи все ще встановлюють різні ліміти залежно від потужності адаптера, але принаймні ви не в «режимі батареї».

Рішення: Якщо online: no, припиніть тестування продуктивності. Підключіть адаптер. Потім перевірте знову, бо режим батареї часто сильно зменшує TGP.

Завдання 8: Подивитися, чи є ліміти по CPU, що «голодують» GPU

cr0x@server:~$ sudo turbostat --Summary --quiet --interval 2 | head -n 6
Avg_MHz   Busy%   Bzy_MHz  IPC   PkgWatt  CorWatt  GFXWatt
3180      62.14   5116     1.41  62.33    39.88    0.05
4022      71.02   5663     1.38  78.90    52.41    0.06

Що це означає: Енергоспоживання пакета CPU високе. У спільному тепловому дизайні це може зменшити GPU‑запас через Dynamic Boost у зворотному напрямку або теплове насичення.

Рішення: Якщо продуктивність GPU падає при активності CPU, обмежте буст CPU (налаштування OEM, план живлення) або обирайте ноутбук з кращим спільним охолодженням.

Завдання 9: Перевірити логи ядра на події тепла або живлення

cr0x@server:~$ sudo dmesg -T | egrep -i 'thrott|thermal|power limit' | tail -n 8
[Tue Jan 13 10:18:11 2026] thermal thermal_zone7: critical temperature reached (105 C), shutting down
[Tue Jan 13 10:19:42 2026] CPU: Package power limit exceeded, capping frequency
[Tue Jan 13 10:23:15 2026] nvidia-modeset: WARNING: GPU temperature threshold exceeded, performance state reduced

Що це означає: Система сама вас видає. Ці повідомлення відрізняють «TGP низький за дизайном» від «ваше охолодження відмовляє».

Рішення: Якщо бачите критичні теплові події — зупиніть тест. Очистіть, замініть термопасту, перевірте роботу вентиляторів і вентиляцій. Це робота з надійністю, а не дрібний тюнінг.

Завдання 10: Перевірити керування вентиляторами і теплові зони (чи вентилятори реагують?)

cr0x@server:~$ sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +93.0°C  (high = +100.0°C, crit = +105.0°C)

nvme-pci-0100
Adapter: PCI adapter
Composite:    +68.9°C  (low  =  -0.1°C, high = +84.8°C)

nvidia-gpu-pci-0100
Adapter: PCI adapter
temp1:        +79.0°C

Що це означає: CPU працює гарячо, GPU — тепло, NVMe — тепло. Той NVMe‑показник важить більше, ніж здається: тротлінг SSD може маскуватися під «повільний GPU» у робочих процесах контент‑продукції.

Рішення: Якщо CPU близький до критичного при змішаному навантаженні, очікуйте падіння потужності GPU. Поліпшіть охолодження, змініть режим або зменшіть буст CPU.

Завдання 11: Перевірити тротлінг NVMe під час «GPU‑робочих навантажень», що фактично стрімлять дані

cr0x@server:~$ sudo nvme smart-log /dev/nvme0n1 | egrep -i 'temperature|warning|critical'
temperature                         : 69 C
warning_temp_time                   : 17
critical_comp_time                  : 0

Що це означає: SSD провів час вище своєї warning‑температури. При великих збірках активів або прокручуванні відео це може знизити пропускну здатність і викликати зупинки.

Рішення: Якщо час у warning росте під час вашого навантаження, додайте термопрокладку/радіатор для SSD, покращіть потік повітря або уникайте ноутбуків, де NVMe встановлений під гарячим GPU.

Завдання 12: Перевірити, чи GPU досягає причин «PerfCap» (потужність vs температура)

cr0x@server:~$ nvidia-smi -q -d PERFORMANCE | sed -n '/Performance State/,/Clocks Event Reasons/p'
    Performance State                  : P2
    Clocks Event Reasons
        Idle                           : Not Active
        Applications Clocks Setting     : Not Active
        SW Power Cap                    : Active
        HW Slowdown                     : Not Active
        HW Thermal Slowdown             : Not Active
        Sync Boost                      : Not Active

Що це означає: GPU обмежується програмним лімітом потужності, а не теплом. Це відбиток низького TGP‑кепу або режиму, що обмежує ватаж.

Рішення: Якщо SW Power Cap: Active домінує, ганяйте за політикою живлення (режим OEM, Dynamic Boost, драйвер, VBIOS‑ліміти). Якщо активний HW Thermal Slowdown, працюйте над охолодженням.

Завдання 13: Слідкувати за політикою масштабування частоти CPU (важливість Linux governor)

cr0x@server:~$ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
powersave

Що це означає: У вас встановлено powersave. На багатьох системах це може знизити відгук і змінити спосіб, у який платформа ділить енергію.

Рішення: Для тестування продуктивності встановіть узгоджену політику. Якщо не можете — ваші бенчмарки марні.

Завдання 14: Встановити узгоджений governor CPU для відтворюваних тестів

cr0x@server:~$ sudo apt-get install -y linux-tools-common linux-tools-generic
...output...
cr0x@server:~$ sudo cpupower frequency-set -g performance
Setting cpu: 0
Setting cpu: 1
Setting cpu: 2
Setting cpu: 3

Що це означає: Ви прибрали одне джерело варіативності. Тепер поведінка GPU легше інтерпретується.

Рішення: Виконайте це перед порівнянням «режим A vs режим B» або перед тим, як звинувачувати TGP. Інакше ви вимірюєте governor.

Завдання 15: Підтвердити, чи система працює в вендорському «тихому» режимі (поширений прихований TGP‑клапан)

cr0x@server:~$ cat /sys/firmware/acpi/platform_profile
quiet

Що це означає: Платформа явно налаштована на тиху роботу. Це часто означає знижену криву вентиляторів і зменшений TGP.

Рішення: Переключіться на performance або balanced для серйозної роботи, якщо вам потрібен GPU. Якщо це неприйнятно по акустиці — ви купили не той корпус для задачі.

Завдання 16: Перемкнути профіль платформи (коли підтримується) і повторно виміряти ліміт потужності

cr0x@server:~$ echo performance | sudo tee /sys/firmware/acpi/platform_profile
performance
cr0x@server:~$ nvidia-smi --query-gpu=power.limit --format=csv
power.limit [W]
140.00 W

Що це означає: На деяких системах ліміт GPU змінюється з профілем; на інших — ні. Важливо не вгадувати, а виміряти.

Рішення: Якщо ліміт зростає після зміни профілю, закладіть це в стандартну процедуру. Якщо ні — ви, ймовірно, обмежені VBIOS або жорсткими OEM‑лімітами.

Три корпоративні міні‑історії з реального світу

Міні‑історія 1: Інцидент, спричинений неправильною припущенням

Команда дизайнерів прийняла новий стандарт ноутбуків для розподіленої групи, що робить GPU‑прискорені рендери. Закупівля зробила своє: уніфікувалися на одній «RTX‑класовій» моделі і домовилися про знижку. Спочатку всі були щасливі. Десь два тижні.

Потім потік тикетів почався. Рендери стали займати на 30–50% більше часу, ніж попереднє покоління. Люди припускали регресії драйвера, потім звинувачували рендерер, потім підозрювали оновлення Windows. SRE потяглися, бо «рендер‑ферма повільна», хоча половина задач була локально на ноутбуках.

Команда зробила очевидне: бенчмарки старого і нового бок‑о‑бок. Новий ноутбук вискакував до вражаючих частот хвилину, а потім сідала на стабільний стан, який був… підозріло посередній. Теплові показники були в порядку. Вентилятори — тихі. Надто тихі.

Причина виявилася болісно простою: вони припустили, що назва GPU означає клас продуктивності. Ні. GPU у новому ноутбуці був сконфігурований на значно нижчий TGP, ніж у попередній моделі. Тот же знак. Інша фізика. Вендор оптимізував корпус для акустики і часу роботи від батареї, і ліміт GPU був частиною того компромісу.

Виправлення не було дрібним тюнінгом. Це була зміна закупівлі. Команду перевели на товстіший корпус з вищим сталим лімітом потужності і додали «мінімальну сталу потужність GPU» як жорстку вимогу в наступний RFP. Справжній урок: тримайте назву GPU як підказку, а не як контракт.

Міні‑історія 2: Оптимізація, що обернулася проти нас

Продуктова група хотіла довшого часу роботи від батареї під час поїздок. Вони впровадили скрипт «ефективності»: встановити профіль платформи в quiet, віддавати перевагу iGPU для більшості додатків і обмежити продуктивність CPU. Розгортання пройшло чисто, автоматизовано і з гарними намірами.

Потім з’явилися дивні баги. Розробники казали, що Docker‑збірки в порядку, але їхні ML‑ноутбуки поводились непередбачувано. Іноді тренування були швидкі, іноді — повільні. Відеодзвінки іноді викликали підвисання під час GPU‑важкого компілювання. Всі звинувачували «драйвер GPU», бо це зручна мішень.

Постмортем показав класичну історію «зіткнення двох оптимізацій». Quiet‑режим зменшив агресивність вентиляторів і обмежив потужність GPU. Тим часом обмеження CPU змінило спосіб, у який платформа ділила спільну енергію. Під змішаними навантаженнями — браузер, дзвінок, ноутбук — система почала коливатися між політиками, і GPU непередбачувано впирався в ліміти.

Вони намагалися налаштувати це скриптами. Стало гірше. Справжнє виправлення було банальним: відокремити режим подорожі від режиму робочої станції і зробити перемикання явним. На мережі в робочому режимі ноутбук працював із стабільним високим лімітом GPU і передбачуваними термальними характеристиками. На батареї в режимі подорожі користувачі приймали повільніше тренування як компроміс.

Оптимізація провалилася, бо не мала чіткого охоплення. Політики ефективності мають бути опціональними і підлаштованими під навантаження. Інакше вони стають невидимими інцидентами продуктивності.

Міні‑історія 3: Нудна, але правильна практика, що врятувала ситуацію

Медіа‑команда мала звичку, що здавалася педантичною: кожний новий SKU ноутбука проходив короткий «тест стійкої продуктивності». Десять хвилин навантаження GPU, десять хвилин навантаження CPU, потім десять хвилин комбінованого навантаження. Вони логували споживання, частоти та температури і зберігали результати поруч із записами закупівель.

Це не було гламурно. Не увійшло в презентації. Однак створило базову лінію. Коли після оновлення прошивки в середині кварталу редактори почали скаржитися на збільшення часу експорту, команда не сперечалася з відчуттями. Вони порівняли нову телеметрію з базовою.

Дані показали, що ліміт потужності GPU не змінився, але змінилася поведінка кривої вентиляторів; тепер GPU досягав теплового уповільнення за тих же умов. Оновлення, ймовірно, було корекцією за шумом. Команда відкотила прошивку на уражених одиницях, зафіксувала робочу версію і підняла питання до вендора з доказом.

Вони уникнули місяця втрати продуктивності, бо ставили до ноутбуків як до продакшн‑систем: базуйте, спостерігайте і контролюйте зміни. Нудно. Правильно. Ефективно.

Поширені помилки: симптом → причина → виправлення

Тут ми припиняємо звинувачувати «поганий кремній» і починаємо діагностувати по‑дорослому.

1) Симптом: «Той самий GPU, що в оглядах, але на 20–40% повільніший»

Причина: Нижча конфігурація TGP (зазвичай пов’язана з тонким корпусом, тихим профілем або регіональним SKU).

Виправлення: Перевірте ліміт потужності через nvidia-smi. Перевірте режим продуктивності OEM і налаштування MUX. Якщо ліміт фундаментально низький — обміняйте на SKU з вищим TGP або інший корпус.

2) Симптом: «Швидкий перший хвилина, потім падає і залишається низьким»

Причина: Теплове насичення або перегрів VRM; іноді спільні теплові трубки з CPU викликають прогрів.

Виправлення: Логуйте температури і причини PerfCap. Почистіть вентилятори, перевірте підйом вентилятора, подумайте про repaste. Зменшіть буст CPU для змішаних навантажень.

3) Симптом: «GPU не перевищує X ват навіть коли холодно»

Причина: Програмний ліміт потужності (політика), VBIOS‑ліміт або OEM‑клапан режиму.

Виправлення: Переключіть профіль платформи, переконайтеся в AC‑живленні і правильному адаптері, оновіть BIOS/EC і повторіть тест. Якщо без змін — прийміть як проектний ліміт.

4) Симптом: «Зовнішній монітор робить ігри швидшими»

Причина: Внутрішній дисплей маршрутизований через iGPU (Optimus), зовнішній порт підключений до dGPU.

Виправлення: Використовуйте MUX «тільки dGPU» для внутрішнього дисплея, якщо доступно, або підключайте перфоманс‑критичні сесії до порту, що прив’язаний до dGPU.

5) Симптом: «Завантаження GPU низьке, але FPS теж низький»

Причина: Вузьке місце в CPU, бюджет відбирає CPU, або обмеження синхронізації/частоти (V‑Sync, ліміт кадрів).

Виправлення: Перевірте пакетну потужність CPU і частоти по ядрам під навантаженням, тимчасово відключіть обмеження для тесту і порівняйте поведінку GPU‑тільки проти комбінованого навантаження.

6) Симптом: «Продуктивність непослідовна день у день»

Причина: Зміни навколишньої температури, накопичення пилу, оновлення прошивки або фонові додатки, що змінюють навантаження CPU (і відповідно спільний бюджет).

Виправлення: Робіть базову лінію в контрольованому режимі, відстежуйте версії прошивки/драйверів і вимірюйте причини PerfCap, щоб відділити термальні проблеми від політик.

7) Симптом: «На батареї — непридатно»

Причина: Ліміти розряду батареї сильно урізують потужність GPU і CPU, щоб захистити акумулятор.

Виправлення: Прийміть фізику. Для GPU‑задач підключайтесь до мережі. Якщо потрібна продуктивність на батареї — це інший клас пристрою (і він буде важчим).

8) Симптом: «Після оновлення драйвера GPU не буститься»

Причина: Налаштування скинуті (переважний GPU, режим управління живленням) або баг, що взаємодіє з OEM EC.

Виправлення: Перевірте вибір GPU для додатків, підтвердьте ліміти потужності і відкатуйте драйвер, якщо потрібно. Розглядайте оновлення драйвера як вікно змін.

Контрольні списки / покроковий план

Чекліст для закупівлі: як не купити «той самий GPU» неправильно

  1. Вимагайте діапазон TGP у письмовій формі для точного SKU (не сімейства продуктів).
  2. Вимагайте в комплекті вказану потужність адаптера; не погоджуйтеся з «залежить від регіону».
  3. Запитайте про наявність MUX‑перемикача і чи можна його примусово встановити в режим dGPU‑only.
  4. Попросіть ствердження про сталу продуктивність (10–20 хвилин навантаження), а не лише «boost clock».
  5. Надавайте перевагу оглядам із логами ватажу в часі і з причинами PerfCap, а не лише середнім FPS.
  6. Купіть один пристрій спочатку, запустіть intake‑тест і лише потім масштабуйте замовлення.

Чекліст intake‑тесту (15–30 хвилин на модель)

  1. Оновіть ОС, але зафіксуйте версії драйверів на час тесту.
  2. Встановіть узгоджений профіль платформи (balanced або performance) і підтвердіть AC‑живлення.
  3. Логуйте потужність/частоту/температуру GPU кожні 2 секунди під тривалим навантаженням.
  4. Запустіть лише CPU‑навантаження і спостерігайте, чи зміниться ліміт GPU після цього.
  5. Запустіть комбіноване CPU+GPU‑навантаження і виміряйте, чи колапсує потужність GPU.
  6. Запишіть температуру навколишнього середовища і суб’єктивний рівень шуму вентиляторів («тихий, терпимий, фен»).
  7. Збережіть логи разом з записом закупівлі.

Чекліст операцій: коли користувач каже «мій GPU‑ноутбук повільний»

  1. Підтвердіть, що додаток використовує dGPU (а не iGPU).
  2. Підтвердіть, що ноутбук підключений до мережі і не в тихому профілі.
  3. Перевірте ліміт потужності в nvidia-smi і причини PerfCap під навантаженням.
  4. Перевірте температури і повідомлення dmesg про тротлінг/ліміти потужності.
  5. Перевірте, чи змінюється продуктивність при зовнішньому дисплеї.
  6. Прийміть рішення: конфігураційне виправлення, технічне обслуговування або зміна закупівлі.

Жарт №2: Якщо ви хочете, щоб ноутбук був тонким, тихим, холодним і швидким — ви шукаєте єдинорога, який живиться від 240W‑адаптера.

Питання та відповіді

1) Що таке TGP точно?

TGP — це бюджет потужності, який ноутбук дозволяє GPU споживати під тривалим навантаженням. Вищий TGP зазвичай означає вищі сталi частоти й продуктивність — якщо тільки охолодження встигає.

2) Чому два ноутбуки з однаковою назвою GPU показують різну продуктивність?

Бо назва не включає ліміти потужності, можливості охолодження, проєкт VRM, правила спільного розподілу енергії від OEM або маршрут дисплея. У ноутбуках саме ці фактори і є продуктом.

3) Чи можна вірити «до 140W»?

Це стеля, а не обіцянка. Ви можете досягти її лише за конкретних умов: живлення від мережі, режим продуктивності, прохолодне оточення і навантаження, що орієнтоване на GPU без відбирання бюджету CPU.

4) Чи вищий TGP завжди кращий?

Не завжди. Після певного рівня віддача зменшується, а також з’являється більше шуму й тепла. Деякі високотG‑ноти мають посереднє виконання охолодження і все одно тротлять.

5) Як перевірити TGP на вже наявному ноутбуці?

У NVIDIA nvidia-smi часто показує ліміт потужності. Надійніший метод — логувати фактичне споживання під тривалим навантаженням і перевіряти причини PerfCap, щоб зрозуміти, що саме вас обмежує.

6) Який зв’язок між Dynamic Boost і TGP?

Dynamic Boost може переміщувати бюджет між CPU і GPU. Він може ефективно підвищити потужність GPU в GPU‑важких навантаженнях, але також може знизити GPU‑запас, коли CPU раптово навантажується.

7) Чи впливає MUX‑перемикач на TGP?

Безпосередньо — ні, але він може змінювати реалізовану продуктивність. MUX може маршрутизувати дисплей прямо до dGPU, зменшуючи накладні витрати і іноді покращуючи стабільність і латентність.

8) Чи допоможе undervolting на ноутбуку з низьким TGP?

Він може покращити ефективність і терміни, що іноді дозволить GPU тримати вищі частоти в межах того ж ліміту потужності. Але undervolt не перетворить дизайн на 60W у дизайн на 140W.

9) Чому GPU нагрівається високо навіть при помірних ватах?

Обмеження охолодження: забиті вентиляційні отвори, висохла термопаста, погане прилягання, консервативні криві вентиляторів або теплове насичення від CPU. Перевірте також VRM та локальні «гарячі точки», які неочевидні з одного показника «температури GPU».

10) Що пріоритетніше: TGP GPU чи продуктивність CPU для моєї роботи?

Залежить від навантаження. Для GPU‑рендерингу, навчання ML і ігор TGP часто вирішальний. Для компіляцій та симуляцій важливіше стале живлення і охолодження CPU. Багато реальних робочих навантажень змішані, тому потрібен ноутбук, що не колапсує під комбінованим навантаженням.

Висновок: що робити далі

Якщо купуєте: вимагайте вказати ватаж. Не «RTX щось», не «Max performance», не «creator edition». Питайте про діапазон ліміту потужності GPU, потужність адаптера і чи ноутбук може утримувати цю потужність принаймні 10–15 хвилин без тротлінгу. Якщо продавець не може відповісти — розглядайте це як ризик з невідомими межами.

Якщо діагностуєте: припиніть сперечатися на підставі вражень. Виміряйте споживання GPU, ліміти потужності, причини PerfCap і температури під тривалим навантаженням. Визначте, чи обмеження — по потужності, по теплу, чи бюджет забирає CPU. Потім оберіть категорію виправлення: конфігурація, обслуговування або заміна. Системи виробництва не ремонтують бажаннями. Ноутбуки — теж.

← Попередня
Debian 13: «Unit is masked» — без сюрпризів, як безпечно розблокувати й виправити причину (випадок №47)
Наступна →
MySQL vs MariaDB: реплікація та відновлення після відмови — що ламається в реальному житті (і як уникнути)

Залишити коментар