Linux6。2近日合并了一个重要补丁,该补丁能够将一个核心内核函数速度提升715倍。 从合并的注释可知,贡献此补丁的维护者ZhenLei来自华为,他将kallsymslookupname()的平均查找性能提高了715倍,从而使内核里面旧实现的时间复杂度从O(n)升级到O(log(n)),大幅减少查找时间,同时还保留了prockallsyms上旧的实现支持。 kallsymslookupname()函数用于根据名称查找符号的地址,并可用于查找内核符号表中的任何符号。 ZhenLei曾在较早的补丁中描述了kallsymslookupname()的优化思路:目前,要搜索一个符号,我们需要将kallsymsnames中的符号一个一个展开,然后使用展开后的字符串进行比较。这种算法的时间复杂度是O(n)。 如果我们像地址一样按升序对名称进行排序,则可以使用二分查找。这种算法的时间复杂度是O(log(n))。 为了不改变prockallsyms的实现,表kallsymsnames〔〕仍然按照升序与地址一一对应存储。 添加数组kallsymsseqsofnames〔〕,以排序后的names序号为索引,对应的内容为排序后的地址序号。例如:假设NameX在数组kallsymsseqsofnames〔〕中的索引为i,kallsymsseqsofnames〔i〕的内容为k,则NameX对应的地址为kallsymsaddresses〔k〕。kallsymsnames〔〕中的偏移量是getsymboloffset(k)。 请注意,使用此方法内存使用量将增加(4kallsymsnumsyms)字节,接下来的两个补丁将减少(1kallsymsnumsyms)字节并正确处理CONFIGLTOCLANGy的情况。 性能测试结果:(x86) Before: min234,max10364402,avg5206926 min267,max11168517,avg5207587 After: min1016,max90894,avg7272 min1014,max93470,avg7293 kallsymslookupname()的平均查找性能提高了715倍。 因此,该补丁带来的唯一缺点是将内存占用量增加3kallsymsnumsyms。 Linux6。2的模块代码还包含一个小的启动优化,将启动时间缩短了大约30毫秒。 相关链接:https:git。kernel。orgpubscmlinuxkernelgittorvaldslinux。gitcommit?id3ba2c3ff98ea8bfb219288dbacf2a23a902c751b 文章转载自:OSC开源社区