选取500个随机条目并统计不同权限的用户(如优编和自确)共贡献了多少字节,最后根据总和算出贡献比例。源代码(由于请求数过多容易WAF,使用pickle缓存结果)。
点开折叠之前先猜一猜结果是什么,对统计方法有疑问可以看下面。大家觉得萌百哪个用户组贡献了最多的字节数呢?是自确还是优编?
统计结果 |
---|
3038131 bytes total. sysop : 0.77% patroller : 5.81% goodeditor : 45.93% honoredmaintainer: 1.34% autoconfirmed : 43.69% user : 2.45% 管理员 巡查姬 荣誉维护人员 优质编辑者 自动确认用户 注册用户 巡查和管理的数量差不多是萌百所有活跃用户的1%,但是贡献了约6%的字节数。 考虑到部分优编已退站,活跃的优编和荣编差不多是所有活跃用户的10%,但是他们贡献了接近一半的字节数。 由于统计仅包括现有用户组,结果其实不太科学。还有一种思路是把荣编、优编、巡查和管理合并为一类“special”,自确和注册用户合并为一类“common”。结果差不多对半开。 special: 53.86% |
5000个随机条目的统计结果 |
---|
37609460 bytes total. sysop : 1.10% patroller : 6.01% goodeditor : 44.87% honoredmaintainer: 1.52% autoconfirmed : 44.55% user : 1.94% special: 53.50% common : 46.50% 管理员 巡查姬 荣誉维护人员 优质编辑者 自动确认用户 注册用户 |
虚拟UP主条目的统计结果 |
---|
20221163 bytes total. sysop : 1.72% patroller : 2.68% goodeditor : 22.73% honoredmaintainer: 0.24% autoconfirmed : 67.26% user : 5.38% 20221163 bytes total. special: 27.36% common : 72.64% 管理员 巡查姬 荣誉维护人员 优质编辑者 自动确认用户 注册用户 虚拟UP主相关编辑们的一贯印象就是有大量自确参与编辑,但只有很少一部分能被转化为萌娘百科的长期编辑者,这个统计与以上数据的对比支持这一猜想。 统计的页面范围是Category:虚拟UP主及其子分类下的所有主名字空间条目。 |
用户贡献字节数统计 |
---|
|
小编也不知道萌百的中流砥柱是谁。