猫猫酱您好,这里是萌娘百科编辑者一位史蒂夫,抱歉这么晚了来打扰您。这里有一个凭借我们微弱的数学功底无法解决的数学问题,希望能够得到您的帮助与点评。
事情是这样的,萌百虚拟UP主编辑组前段日子为了充分评判跨平台虚拟UP主,推导出了这么一个虚拟UP主综合粉丝量算法。这里的大致思路是,在两个平台活动的虚拟UP主,不能将两个平台的数字直接加和,而是引入一个系数γ来描述两个平台的关系。但是目前这个算法还有着不小的问题,比如只能考虑两个平台的粉丝数。如果引入第三个甚至更多的平台,那么这个算法似乎就无法应用了。
萌百虚拟UP主编辑组的组员几乎都不是数学专业出身,数学知识较为浅陋,仅凭我们的力量似乎并不能很好的解决这个问题。听闻猫猫酱所学的是数学专业,而且您所发布的数学相关视频深入浅出,专业能力令人叹服,所以还希望猫猫酱老师不吝赐教:
请问您如何评价这一算法的合理性呢?以及如果需要引入多个平台,那么这个算法应当如何改进会更好呢?
最后,抱歉占用了您的宝贵时间,以及感谢您的理解与支持!
您好,感谢您的提问。事实上,后面的公式已经有猫猫酱心中觉得合理的答案的影子了。事实上这个问题不像看起来那么简单,因为这涉及两个问题:A是平台之间粉丝数的换算关系,B是就算b站和youtube是粉丝数已经是换算之后的数值,也需要一个二元函数把两个平台的数值转换成一个值。
对于A暂且可以人工规定1油管粉丝代表多少b站粉丝,那么剩下的就是B了。这个问题是数学规划中的多目标规划问题,而对于而对于此处的情况来说最简单的方法就是$$x = \sum x_i \times f(x_1,x_2,...x_n)$$
这里x1到xn是n个平台已经换算过的粉丝,比方说乘一个常数的线性换算。其中根据页面中提供的信息猫猫酱了解到$f$需要满足的性质有①除某个$x_i$以外,其他的$x_i$全为0时$f=1$,②$x$增大时$f$的增速减少。对于后面的算法两个变量的情况来说,猫猫酱也不知道这里为什么多出了一项无用的$\gamma \over (x1+x2)$使得$f$在$x_i=0$的时候不为1。
如果不看这个无用项的话,他的式子变为$$1+{2 \gamma x_1x_2 \over (x_1+x_2)^2}$$
这里面$2\gamma$代表之前提到的问题A暂且不表,剩下的$f(x_1,x_2)= 1+{x_1x_2\over(x_1+x_2)^2}$就是我之前提到的$f$,注意到$x_1=0$时或者$x_2=0$时后面的项为0所以满足最基本的性质①。对于性质②,我们验证$x_1x_2$同阶的情况。分子是$x_1x_2$,分母是$x_1^2+2x_1x_2+4x_2^2\to4x_1x_2$,大概两个平台的等价粉丝数相等的时候是增加常数分之一的粉丝。这样的性质是很合理的。
说了这么多,猫猫给出一下自己的看法吧。为了更合理,这个算法应该分为两步。对于$y_1,y_2,...y_n$共$n$个平台的粉丝数:
第一步用一些人工决定的常数将他们换算(比如推特1w粉=1000等价粉丝,油管1w=1w等价粉丝,b站1w=1w等价粉丝,脸书1w=500等价粉丝)
$$x_1=C_1y_1$$
$$x_2=C_2y_2$$
$$...$$
$$x_n=C_ny_n$$
其中$x_i$代表第i个平台的等价粉丝
使用满足性质①和性质②的某个n元函数$f$计算最终的粉丝数
这里面比如说,后面公式中的延伸算法,也就是$$f(x_1,x_2,...x_i)=1 + {\prod x_i \over (\sum x_i)^2} \times 某个常数$$就是一个很简单的例子,建议使用。
代入公式$x =\sum x_i \times f(x_1,x_2,...x_i)$即可。
以上就是猫猫酱的看法!
当然,事实上这个$f$不能因为一个$x_i$为0就变为1。为了修正这个问题,一个简单的方法是新建一个函数$bool$,使得$bool(0)=1,bool(x)$。此时$$f(x_1,x_2,...x_i)=1 + {\prod bool(x_i) \over (\sum x_i)^2} \times 某个常数$$即可满足某个$x_i$为0的时候,不影响函数的计算。可以考虑一下。
如果觉得有用的话希望可以提一下猫猫酱的名字哦!感谢
抱歉!f的取值可能还需要更加讨论。猫猫再想想哦
稍微想了一下,应该提前将无数据的平台剔除,并使用n个有数据的平台的加权方式$f(x_1,x_2,...x_n)$,例如$$f(x_1,x_2,..x_n) =1 + g(n) \times {\prod(x_i) \over ({\sum x_i \over n})^n}$$
其中$g(n)$是某个函数,使得$g(1)=0$,后面的$g$作为可调整的常数
首先,对于$n>1$时,$x_1=x_2...=x_n$的情况,我们一律有$f(x_1,x_2,..x_n)=1+g(n)$
对于只有一个平台$n=1$的情况,$f(x_1)=1$
对于有两个平台$n=2$的情况,$f(x_1,x_2)=1 + 4 g(n) \times {x_1x_2 \over (x_1+x_2)^2}$,类似之前您发的链接中后半的计算方式
对于三个平台的情况,$f(x_1,x_2,x_3) = 1+27 g(n) \times {x_1x_2x_3 \over (x_1+x_2+x_3)^3}$
猫猫想说的是,不一定把所有情况都放在一个公式里就是最好的。应该按需调整。