个人随笔
目录
Oracle的varchar2字段可以放入的汉字数以及Java截取字节的方法
2019-07-01 23:55:57

Oracle的varcha2和MySQL的varchar是有区别的,Oracle放的是字节,所以如果Oracle的编码集是GBK,可以用如下语句查看,那么,varcha2(100)就只能存放50个汉字,但是MySQL的却是100个,因为Mysql是按照字符来算的。

  1. select userenv('language') from dual;

也因为这样,我们有时候会发现,当数据长度超过的时候会报长度超过限制的异常,此时我们可能会直接在java中用字符串截取的方式来截取。但是这样子要注意,我们必须按字节来截取,当然是Oracle的情况下,可以用如下方法来操作(java其实是不需要这样子处理的,直接扩展字段即可,但是有些业务场景扩展不了就只能截取了):

  1. /**
  2. * 根据指定的字节长度截取字符串
  3. * @param orignal : 原始字符串
  4. * @param count : 要截取的字节长度
  5. * @return
  6. */
  7. public static String substringByByteLength(String orignal, int count){
  8. if(orignal != null && !"".equals(orignal)){
  9. int tmp = count;
  10. try {
  11. orignal = new String(orignal.getBytes("GBK"),"GBK");
  12. System.out.println(orignal.getBytes("GBK").length);
  13. if(tmp > 0 && tmp < orignal.getBytes("GBK").length){
  14. System.out.println("截取前的值:"+orignal);
  15. StringBuffer buff = new StringBuffer();
  16. char c;
  17. for(int i = 0; i < tmp; i++){
  18. c = orignal.charAt(i);
  19. if((buff.toString() + String.valueOf(c)).getBytes("GBK").length <= count ){
  20. buff.append(c);
  21. }
  22. if(isChinese(c)){
  23. --tmp; //遇到中文汉字,截取字节总数减1
  24. }
  25. }
  26. String str = buff.toString();
  27. System.out.println("截取后的值:"+str);
  28. return str;
  29. }
  30. return orignal;
  31. } catch (UnsupportedEncodingException e) {
  32. e.printStackTrace();
  33. }
  34. }
  35. return "";
  36. }
  37. public static boolean isChinese(char ch) {
  38. //获取此字符的UniCodeBlock
  39. Character.UnicodeBlock ub = Character.UnicodeBlock.of(ch);
  40. // GENERAL_PUNCTUATION 判断中文的“号
  41. // CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号
  42. // HALFWIDTH_AND_FULLWIDTH_FORMS 判断中文的,号
  43. if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {
  44. return true;
  45. }
  46. return false;
  47. }
 864

啊!这个可能是世界上最丑的留言输入框功能~


当然,也是最丑的留言列表

有疑问发邮件到 : suibibk@qq.com 侵权立删
Copyright : 个人随笔   备案号 : 粤ICP备18099399号-2