本帖最后由 德小SHUO 于 2022-2-2 19:56 编辑
Python 取随机生僻字
个人屑作,效率低,比较耗资源。但是每秒 6000 个字不成问题,可能有重复。
原理
在中文 Unicode 范围内随机生成一个字,判断其是否能转换到 GB2312 编码。如果转换失败那就是生僻字。
没有被 GB2312 收录的汉字,对大家来说应该算是生僻字了吧...
代码
from random import randint
def randUnicode():
value = randint(0x4e00, 0x9fbf)
return chr(value)
""" 随机输出最多 10 个生僻字 """
for i in range(10):
word = randUnicode()
try:
word.encode("gb2312")
except UnicodeEncodeError:
print(word, end="")
效果预览
潙騑瑱臺驪滍嬛噝軏攬糋蘲奝釹暺悾祘鱰挋櫀惙胐榠溕龫彁寢斖賧矡鈐餵艤餽雡圕蹆傶銙憦鏪毸謌袩閃嬂郣鄭芿讱鞖犨厀襹熋鈛弚骵俈釯凃覊熕皘艒栫銰據覙騴墎駊顬攟愙揘蛻莙閌掓厜龦壝觟饠撜瓀啝軐矆嘯飣幁鍋嶥瘂慖嚡璌澢
|