Обычная версия
Java форум JavaTalks
форум программистов

Поиск   Пользователи   Группы   Регистрация 
 Профиль   Личные сообщения 

 Вход 

Как фильтровать четырехбайтовые символы перед вставкойв базу
Список форумов
 ->  Веб-серверы и серверы приложений


 
Начать новую тему 
Предыдущая тема :: Следующая тема  
Автор Сообщение
Косс : 2
Новичок

СообщениеЯнв 31, 2012 12:06 
Ответить с цитатой
Всем привет!
Занимаюсь webmail, который скачивает и сохраняет данные из почты в mysql 5.1
Как известно полной поддержки 4х байтовых символов в mysql 5.1 нет.
База огромная(около 16 гигов), поэтому менять ее трудоемкая задача.

В webmail приходят письма именно с 4х байтовой кодировкой, при это при сохранении в Java появляется exception:
java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\xA1\x0A\x0A...' for column 'text' at row 1
и письмо никак не сохраняется.
Я думаю лучший вариант, перед вставкой просто удалять символы с такой кодировкой. Как это лучше сделать?
К началу Посмотреть профиль Отправить личное сообщение
Skipy : 4805
Я тут живу!
Откуда: Москва, Россия

СообщениеФев 01, 2012 12:08 
Ответить с цитатой
А что такое четырехбайтовые символы? В какой это кодировке?
_________________
С уважением,
Евгений aka Skipy
www.skipy.ru
P.S. Я НЕ решаю задачи ЗА других!
К началу Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Косс : 2
Новичок

СообщениеФев 03, 2012 11:45 
Ответить с цитатой
кодировка utf-8, вот здесь написано об этом подробно
http://mzsanford.wordpress.com/2010/12/28/mysql-and-unicode/
"The MySQL 5.1 implementation (like many others) was built on the assumption that a UTF-8 encoded character would use between 1 and 3 bytes."

но нам эти 4-х байтовую кодировку поддержать непринципиально, вот я и думаю, может как то можно удалять их
К началу Посмотреть профиль Отправить личное сообщение
 
Начать новую тему  Ответить на тему
Страница 1 из 1
Список форумов
 -> Веб-серверы и серверы приложений


 
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Java and all Java-related trademarks and logos are trademarks or registered trademarks of Oracle Corporation in the United States and other countries.
Это сайт не относится к фирме Oracle Corporation и не поддерживается ею.

© 2006-2010 www.javatalks.ru: форум java программистов
Используется скрипт phpBB © 2001, 2010 phpBB Group

Хостинг от bizname.ru