【字符转换】——全角和半角转换

news/2024/10/17 18:19:16/

背景

在我们使用搜狗输入法的时候会有全角和半角的切换,首先看一下这两者的区别吧

全角,指一个字符占用两个标准字符位置的状态,也是排字的度量单位,宽度等于所使用的文字的磅数汉。

半角,即一个字符占用一个标准字符的位置,排字的量度单位,宽度等于同一磅数全角的一半。

全角和半角的使用

1、在中文输入法中,切换全角和半角格式的快捷键为SHIFT+空格。

2、一般的系统命令是不用全角字符的,只是在作文字处理的时候才会使用全角字符。

3、在编程序的源代码中只能使用半角标点,但是字符串内部的数据可以使用全角字符或者全角标点。

4、在不支持汉字等语言的计算机上只能使用半角标点。其实,在这种情况下根本就不存在全角半角的概念了。

5、在汉字输入法中,输入的字母数字默认为半角,但是标点则是默认为全角。

6、在进行中文处理时,汉字和标点符号使用全角,字母、其它符号和数字使用半角。即王码五笔字型中的默认输入状态就是。

在进行英文处理时,如:英文输入、编写程序、电子邮件地址、网站URL等。全部使用半角进行处理。

但是我们在日常开发的过程中可能需要对输入的字符进行校验,规则只能是全角字符或者是半角字符,这样我们就需要对校验的字符进行装换,所以才有了这篇文章。

一、代码

/*** @author 2019/6/23 16:49*/
public class CharacterUtil {/*** 半角对应ASCII表中可见字符从!开始,偏移位值为33(Decimal)*/private static final char DBC_CHAR_START = 33;/*** 半角对应ASCII表中可见字符到~结束,偏移位值为126(Decimal)*/private static final char DBC_CHAR_END = 126;/*** 全角对应于ASCII表的可见字符从!开始,偏移值为65281*/private static final char SBC_CHAR_START = 65281;/*** 全角对应于ASCII表的可见字符到~结束,偏移值为65374*/private static final char SBC_CHAR_END = 65374;/*** ASCII表中除空格外的可见字符与对应的全角字符的相对偏移*/private static final int CONVERT_STEP = 65248;/*** 全角空格的值,它没有遵从与ASCII的相对偏移,必须单独处理*/private static final char SBC_SPACE = 12288;/*** 半角空格的值,在ASCII中为32(Decimal)*/private static final char DBC_SPACE = 32;/*** <PRE>* 半角字符->全角字符转换* 只处理空格,!到˜之间的字符,忽略其他* </PRE>*/private static String bj2qj(String src) {if (src == null) {return null;}StringBuilder buf = new StringBuilder(src.length());char[] ca = src.toCharArray();for (char c : ca) {if (c == DBC_SPACE) { // 如果是半角空格,直接用全角空格替代buf.append(SBC_SPACE);} else if ((c >= DBC_CHAR_START) && (c <= DBC_CHAR_END)) { // 字符是!到~之间的可见字符buf.append((char) (c + CONVERT_STEP));} else { // 不对空格以及ascii表中其他可见字符之外的字符做任何处理buf.append(c);}}return buf.toString();}/*** <PRE>* 全角字符->半角字符转换* 只处理全角的空格,全角!到全角~之间的字符,忽略其他* </PRE>*/private static String qj2bj(String src) {if (src == null) {return null;}StringBuilder buf = new StringBuilder(src.length());char[] ca = src.toCharArray();for (char c : ca) {if (c == SBC_SPACE) {buf.append(DBC_SPACE);} else if (c >= SBC_CHAR_START && c <= SBC_CHAR_END) {buf.append((char) (c - CONVERT_STEP));} else {buf.append(c);}}return buf.toString();}public static void main(String[] args) {String s1 = "gsrtt art j r sfweegarv 哈哈哈";String s2 = "erg Ddca       sdvdv777774aaa好啊 好啊";String s3 = " 11";String s4 = "  11";System.out.println(s1 + "==" + qj2bj(s1));System.out.println(s2 + "==" + qj2bj(s2));System.out.println(s3 + "==" + qj2bj(s3));System.out.println(s4 + "==" + qj2bj(s4));System.out.println(s1 + "==" + bj2qj(s1));System.out.println(s2 + "==" + bj2qj(s2));System.out.println(s3 + "==" + bj2qj(s3));System.out.println(s4 + "==" + bj2qj(s4));}
}

二、结果验证

Connected to the target VM, address: '127.0.0.1:61997', transport: 'socket'
gsrtt art j r sfweegarv 哈哈哈==gsrtt art j r sfweegarv 哈哈哈
erg Ddca       sdvdv777774aaa好啊 好啊==erg Ddca       sdvdv777774aaa好啊 好啊11== 1111==  11
gsrtt art j r sfweegarv 哈哈哈==gsrtt art j r sfweegarv 哈哈哈
erg Ddca       sdvdv777774aaa好啊 好啊==erg Ddca       sdvdv777774aaa好啊 好啊11== 1111==  11
Disconnected from the target VM, address: '127.0.0.1:61997', transport: 'socket'

 


http://www.ppmy.cn/news/530714.html

相关文章

了解全角和半角,以及全角和半角的相互转换

一、关于全角和半角 1、什么是全角&#xff0c;半角&#xff1f; 全角&#xff1a;是一种电脑字符&#xff0c;是指一个全角字符占用两个标准字符&#xff08;或两个半角字符&#xff09;的位置。全角占两个字节。 汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号…

全角和半角

一、是什么&#xff1f; 「全角」和「半角」是指计算机中CJK 字符的显示格式。&#xff08;读完全文就可知&#xff0c;这是个不算太严谨但可以稍加补充解释&#xff0c;就能严谨的定义&#xff09; 字符存储空间 在计算机字符被设计时&#xff0c;西方字符&#xff0c;例如拉…

中文全角和半角输入有什么区别?

在计算机屏幕上&#xff0c;一个汉字要占两个英文字符的位置&#xff0c;人们把一个英文字符所占的位置称为"半角"&#xff0c;相对地把一个汉字所占的位置称为"全角"。在汉字输入时&#xff0c;系统提供"半角"和"全角"两种不同的输入…

字符全角半角转换及特殊符号转换

近段时间&#xff0c;对数据字段进行清洗加工时经常要涉及去掉特殊符号&#xff08;比如空格、回车、换行等&#xff09;、括号要用中文括号、字母要大写、全角字符转半角字符等操作&#xff0c;每次处理时都需要写很多replace和替换字符&#xff0c;太耗时&#xff0c;看起来也…

空格如何处理(全角和半角的区分)

1)Issue1: 全角空格如何表示 solution1&#xff1a;需要用\u3000. 例如&#xff1a; ${actual_carousel_title_2} AppiumLibrary.Get Text ${register_carousel_text_tilte2_locator} Should be Equal ${actual_carousel_title_2} または、本人確認書類&#xf…

什么是全角和半角

A 什 么 是全角和半角&#xff1f; &#xff08; 1 &#xff09;全角 --- 指一个字符占用两个 标 准字符位置。 汉 字字符和 规 定了全角的英文字符及国 标 GB2312-80 中的 图 形符号和特殊字符都是全角字符。一般的系 统 命令是不用全角字符的&#xff0c;只是在作文字 处 理…

全角字符和半角字符

2017/10/11 工作任务&#xff1a;将其中所有的全角字符按GBK编码计算长度&#xff0c;半角字符不做改动 一.全角字符和半角字符 在计算机屏幕上&#xff0c;一个汉字要占两个英文字符的位置&#xff0c;人们把一个英文字符所占的位置称为”半角”&#xff0c;相对地把一个汉字…

半角符号

半角符号 编辑 半角符号&#xff0c;即 半角字符中的符号类字符&#xff0c;占用一字节。 中文名 半角符号 字 节 一字节 属 性 符号类 应 用 英文字母 目录 1 半角字符含义 2 全角字符含义 3 内容比较 半角字符含义 编辑 半角---指一字符占用一个标准的字符位置。 …