【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
我又要点名一款软件:Chrome Chrome的诞生,某种意...
机械终于变成了大家不认识的样子了 日常中,大家都在各自岗...
结论:现在市面上的所有AI查重工具都不靠谱。 尤其是有个怪现...
Ive的传记写的很清楚,乔布斯规定只有九个人可以直接向他汇报...
我开发了一个语言 herlang: justj***ac/h...
杭州警察之前还有一个上大分的操作,直接给网约车司机打电话,让...