[identity profile] jgbobby.livejournal.com posting in [community profile] useful_faq
при загрузке таблицы из БД в кодировке win-1251 в БД в кодировке utf-8 увеличивается длина записи при неизменной длине поля, т.е. не все записи влезают в длину поля? При этом длина строки увеличивается в 4 раза. (т.е., предположим, есть поле длиной 10 символов и запись в этом поле длиной 10 символов в кодировке 1251. Эта таблица нормально экспортируется, только, если я предварительно увеличу длину поля до минимум 40 символов). СУБД - DB2. ОС - не важно - пробовал на WIN SERVER 2003, AIX...
Ну и собственно как с этим можно бороться, кроме способа создания новой таблицы с увеличенной в 4 раза длинной поля и заливкой в нее исходной таблицы.

Date: 2009-11-20 07:37 am (UTC)
From: [identity profile] archaicos.livejournal.com
А символ - это что, это сколько? Точно не байт?
В 1251 каждый символ - это байт.
В UTF-8 кириллические символы займут два байта каждый, а китайские иероглифы - три или четыре.