empty
对于空字符串返回1,对于非空字符串返回0。 结果类型是UInt8。 如果字符串包含至少一个字节,则该字符串被视为非空字符串,即使这是一个空格或空字符。 该函数也适用于数组。
notEmpty
对于空字符串返回0,对于非空字符串返回1。 结果类型是UInt8。 该函数也适用于数组。
length
返回字符串的字节长度。 结果类型是UInt64。 该函数也适用于数组。
lengthUTF8
假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。
char_length,CHAR_LENGTH
假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。
character_length,CHARACTER_LENGTH
假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。
lower, lcase
将字符串中的ASCII转换为小写。
upper, ucase
将字符串中的ASCII转换为大写。
lowerUTF8
将字符串转换为小写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。
upperUTF8
将字符串转换为大写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。
isValidUTF8
检查字符串是否为有效的UTF-8编码,是则返回1,否则返回0。
toValidUTF8
用�
(U+FFFD)字符替换无效的UTF-8字符。所有连续的无效字符都会被替换为一个替换字符。
toValidUTF8( input_string )
参数:
- input_string — 任何一个字符串类型的对象。
返回值: 有效的UTF-8字符串。
示例
SELECT toValidUTF8('\x61\xF0\x80\x80\x80b')
┌─toValidUTF8('a����b')─┐
│ a�b │
└───────────────────────┘
reverse
反转字符串。