[identity profile] kray-zemli.livejournal.com posting in [community profile] useful_faq
Комп используется для расчётов. Во время счета периодически начинает зверски глючить и виснуть. Глюки проявляются только на этом компьютере. Когда глюки начались -- сделать с компом ничего нельзя, даже попытка запустить диспетчер задач выводит сообщение "недостаточно памяти".

В журнале событий полно таких-вот записей:

Тип события:            Ошибка
Источник события:       Srv
Категория события:      Отсутствует
Код события:            2019
Дата:                   03.11.2009
Время:                  9:21:34
Пользователь:           Н/Д
Компьютер:              SUPER
Описание:               Сервер не смог выделить память из невыгружаемого
                        пула памяти, так как невыгружаемый пул пуст.
Данные:
0000: 00 00 04 00 01 00 54 00   ......T.
0008: 00 00 00 00 e3 07 00 c0   ....ã..À
0010: 00 00 00 00 9a 00 00 c0   ....š..À
0018: 00 00 00 00 00 00 00 00   ........
0020: 00 00 00 00 00 00 00 00   ........
0028: 03 00 00 00               ....


Программа при этом продолжает считать, но...

Логи расчетной программы:
+ 03 Nov 10:10:24 DSMC Saving result dataset
+ 03 Nov 10:10:24 DSMC Saving resart info
! 03 Nov 10:10:25 DSMC prmfile.c ('grid.ini'): Error 22 creating './restart0/grid.ini'
! 03 Nov 10:10:25 DSMC Can't save grid.c
  03 Nov 10:10:25 DSMC errno:     22 = Invalid argument
  03 Nov 10:10:25 DSMC LastError: 1450

Итак, при попытке записать что-то в файл -- интересные ошибки. Проблемы с записью в файл проявляются даже по отношению к логам программы.

Пример "исчезнувшего" и "вернувшегося" лога, программа при этом продолжала считать:
  13 Oct 08:39:15 DSMC loop 22461, num mols = 1418495
  13 Oct 08:39:16 DSMC Max 639 mols at cell 1210
  13 Oct 08:39:16 DSMC sm2_time: shr=0 zero=203 seek=297 cnt=360
  13 Oct 08:39:17 DSMC col=95193/243684  cnt=0/0.03278/537/95193 cr=1.62466
  13 Oct 08:39:18 DSMC Time: mv=93 str=0 sm1=860 col=1109 sm2=234
  13 Oct 08:39:18 DSMC loop 22462, num mols = 1418491
  13 Oct 08:39:18 DSMC Max 643 mols at cell 1210
  13 Oct 08:39:19 DSMC sm2_time: shr=0 zero=187 seek=359 cnt=375
  13 Oct 08:39:20 DSMC loop 22463, num mols = 1418547
  13 Oct 10:34:07 DSMC col=93746/240465  cnt=0/0.0322817/623/93746 cr=1.62434
  13 Oct 10:34:07 DSMC Time: mv=78 str=0 sm1=953 col=1125 sm2=157
  13 Oct 10:34:07 DSMC loop 25350, num mols = 1413749
  13 Oct 10:34:08 DSMC Max 615 mols at cell 8470
  13 Oct 10:34:08 DSMC sm2_time: shr=0 zero=156 seek=297 cnt=469
  13 Oct 10:34:09 DSMC col=94004/241446  cnt=0/0.0323705/599/94004 cr=1.62318
  13 Oct 10:34:10 DSMC Time: mv=62 str=0 sm1=922 col=1141 sm2=140

Наиболее логичная причина -- утечка невыгружаемой памяти в каком-то драйвере. Но как узнать в каком? И почему она проявляется не всегда? Например, драйвер может глючить подобным образом только в случае аппаратной ошибки. Но как это проверить?

Конфигурация компа:
Windows XP Personal Service Pack 3 
Terminal Services in Remote Admin Mode, Multiprocessor Free, OEM-Version 
Kernel Version 5.1.2600.5857 
Security 128 bits, 40 bits 
Microsoft Windows XP Home
Build 2600.xpsp_sp3_gdr.090804-1435 

Gigabyte Technology Co., Ltd. 
Model EP45-DS3P 
North Bridge Intel P45/P43/G45/G43 Revision A2 
South Bridge Intel 82801JR (ICH10R) Revision A2 
    
CPU Intel(R) Core(TM)2 Duo CPU E8400 @ 3.00GHz 
Cpu Socket Socket 775 LGA 

BIOS Vendor Award Software International, Inc. 
BIOS Version F5 
BIOS Date 06/18/2008 
BIOS Size 1024 KB 
BIOS Starting Segment E000h 
DMI Version 2.4 

Manufacturer OCZ 
Part Number OCZ2RPR1066A1G 
Capacity 1024 MBytes (4 шт.)
Memory Type DDR2 (PC2-5300) 
Speed 333 MHz (DDR2 667) 
Supported Frequencies 270.3 MHz, 270.3 MHz, 333.3 MHz 
Memory Timings 3-4-4-13-15 at 270.3 MHz, at 1.8 volts (CL-RCD-RP-RAS-RC) 
Memory Timings 4-4-4-13-15 at 270.3 MHz, at 1.8 volts (CL-RCD-RP-RAS-RC) 
Memory Timings 5-5-5-15-19 at 333.3 MHz, at 1.8 volts (CL-RCD-RP-RAS-RC) 
Data Width 64 bits 
EPP SPD Support Yes (Version 16) 
XMP SPD Support No 


SMART винта (винту год):
-------------------------------------------------------------------------
  ID      Name                   Value  Worst  Tresh       Raw    Health
-------------------------------------------------------------------------
  1 Raw read error rate           114     99      6    131990165   ••••• 
  3 Spin-up time                   97     94      0            0   ••••  
  4 Number of spin-up times       100    100     20          132   ••••• 
  5 Reallocated sector count      100    100     36            0   ••••• 
  7 Seek error rate                75     60     30  17319728340   •••   
  9 Power-on time                  95     95      0         4943   ••••  
 10 Spin-up retries               100    100     97            0   ••••• 
 12 Start/stop count              100    100     20          134   ••••• 
184 End-to-End error              100    100     99            0   ••••• 
187 Reported UNC error            100    100      0            0   ••••• 
188 Command timeout               100    100      0            0   ••••• 
189 High Fly writes               100    100      0            0   ••••• 
190 Airflow temperature            56     49     45   44°C/111°F   ••••  
194 HDA Temperature                44     51      0   44°C/111°F   ••••  
194 Minimum temperature            90     51      0    17°C/62°F   -     
195 Hardware ECC recovered         30     26      0    131990165   •     
197 Current pending sectors       100    100      0            0   ••••• 
198 Offline scan UNC sectors      100    100      0            0   ••••• 
199 Ultra DMA CRC errors          200    200      0            0   •••••


Помогите докопаться до истины.

Да, кстати. Комп еще на гарантии. Надо понять, что предъявлять.

Date: 2009-11-03 08:21 am (UTC)
From: [identity profile] 3jia5l-ca6aka.livejournal.com
счетчики производительности спасут отца какой-то там демократии

Date: 2009-11-03 10:08 am (UTC)
From: [identity profile] 3jia5l-ca6aka.livejournal.com
вот хорошая статья для понимания
http://citrix.pp.ru/madden.html
начинать читать с "память"
про цитрикс тут ничего нет, не пугайтесь. применимо к любому виндовому устройству.

Date: 2009-11-03 11:32 am (UTC)
From: [identity profile] john-silver-182.livejournal.com
В железе не силен . Но можно попробовать поставить идущий с платой Gigabyte софт :
EasyTune6 . Скажем взять частоту памяти уменьшит , или FSB .